\documentclass[12pt]{article}
\usepackage[utf8]{inputenc}
\usepackage[english,russian]{babel}
\usepackage{graphicx}
\usepackage{vmumath}
\usepackage{amsmath}
\usepackage{amsthm}
\usepackage{avo_book}
\usepackage{subcaption}
\usepackage[a4paper,left=15mm,right=15mm,top=30mm,bottom=20mm]{geometry}
\parindent=0mm
\parskip=3mm
\noaftermath
\pagestyle{empty}


\begin{document}


\bibliographystyle{unsrt}


\begin{center}
\LARGE Элементарная комбинаторика
\end{center}

\section{Принцип Дирихле}

\myitem Начнем мы данную главу с изложения очень простого принципа, который, однако, является весьма эффективным способом решения многих комбинаторных задач --- принципа Дирихле (или в английском варианте --- Pigeon-Hole Principle). 

\mysubitem В своей простейшей формулировке он гласит следующее:

\begin{propos} 
Если в $n$ ящиков положить $k>n$ предметов (в $n$ клеток посадить $k>n$ голубей), то хотя бы в одном ящике будут лежать по крайней мере два предмета (будут сидеть по крайней мере два голубя). 
\end{propos} 

\evidp Несмотря на всю очевидность данного утверждения, все же дадим его формальное доказательство. Предположим, что утверждение неверно, то есть в каждом ящике находится не более одного предмета. Обозначим через $m$ количество ящиков, в котором ничего не лежит. Очевидно, что $m\geq 0$. Тогда ровно по одному предмету лежит в $(n-m)$ ящиках. Это означает, собственно, что общее количество предметов равно $n-m\leq n<k$, что противоречит условию нашего утверждения. \qed

\mysubitem На первый взгляд совершенно непонятно, как такой настолько простой принцип может использоваться при решении каких-либо серьезных задач, ведь он кажется совершенно очевидным. Однако оказывается, что в конкретных задачах, использующих в своих решениях данный принцип, зачастую очень нелегко понять, где предметы, где ящики, и почему предметов больше, чем ящиков. Далее, далеко не всегда по формулировке самой задачи можно догадаться, что для ее решения следует воспользоваться данным принципом. И наконец, данный принцип дает нам неконструктивное доказательство какого-то факта --- используя его, мы не можем сказать, в каком конкретно ящике находятся два предмета, мы знаем лишь, что такой ящик существует. Попытка же дать конструктивное доказательство, то есть попытка нахождения данного ящика, часто связана с очень большими трудностями. Тем не менее, данный принцип очень полезен, и с его помощью можно доказывать совершенно неочевидные на первый взгляд результаты. 

\mysubitem Приведем вначале простейший пример на применение данного принципа.

\begin{examp} Доказать, что в наборе из любого $(n+1)$-го положительного целого числа найдутся по крайней мере два числа, имеющих один и тот же остаток от деления на $n$.
\end{examp}

Действительно, рассмотрим произвольный набор $\{a_1,a_2,\ldots,a_n,a_{n+1}\}$ положительных целых чисел. Поделив их с остатком на $n$, мы получим набор $\{r_1,r_2,\ldots,r_n,r_{n+1}\}$ из $(n+1)$-го остатка от этого деления --- набор неотрицательных целых чисел, каждое из которых меньше $n$. Но мы знаем, что имеется только лишь $n$ неотрицательных целых чисел, меньших $n$. Следовательно, по принципу Дирихле, хотя бы два остатка из полученного набора должны совпадать. 

\mysubitem Обычно в качестве примера применения принципа Дирихле дается чуть более сложная формулировка того же самого утверждения. Например, требуется доказать, что в последовательности чисел
$$
7,\,77,\,777\,\ldots
$$ 
один из первых $2014$ членов данной последовательности делится на $2013$. 

Вначале ход рассуждений полностью повторяет рассуждения предыдущего примера. Именно, поделив с остатком первые $2014$ членов выбранной числовой последовательности на $2013$, мы получим $2014$ остатков, значение каждого из которых меньше $2013$. Следовательно, согласно принципу Дирихле существуют хотя бы два различных числа с одинаковыми остатками. Обозначим эти числа через $a_i$ и $a_j$, и пусть для определенности $i<j$. Тогда
$$
a_i=2013\cdot q_i+r,\qquad a_j=2013\cdot q_j+r,
$$
а число $(a_j-a_i)$ делится без остатка на число $2013$. Покажем теперь, что число $a_{j-i}$ делится без остатка на $2013$.

Действительно, 
$$
\begin{array}{rc}
\phantom{+}77777777777777777777777777&\text{$j$ цифр}\\
-77777777777777777		& \text{$i$ цифр}\\
=77777777700000000000000000&
\begin{array}{c}\text{$j-i$ цифр, равных $7$,}\\
\text{$i$ цифр, равных $0$},
\end{array}
\end{array}\qquad\Longrightarrow\qquad a_j-a_i=a_{j-i}\cdot 10^i.
$$ 
Но $10^{i}$ и $2013$ взаимно просты, поэтому $a_{j-i}$ делится на $2013$.   

\mysubitem Рассмотрим еще один характерный пример.

\begin{examp} Доказать, что среди нескольких находящихся в одной комнате человек хотя бы двое имеют одинаковое количество знакомых среди присутствующих в комнате.
\end{examp}

Пусть в комнате находится $n$ человек. Тогда для любого из них количество $k$ с ним знакомых может принимать значения от нуля (ни с кем не знаком) до $n-1$ (со всеми знаком). Но отношение знакомства является взаимным: если $a$ знаком с $b$, то и $b$ знаком с $a$. Поэтому, к примеру, невозможен случай, когда в одной комнате имеются одновременно человек, у которого $(n-1)$ знакомых, и человек, у которого $0$ знакомых: в первом случае у второго человека не может быть $0$ знакомых, а во втором --- у первого не может быть $(n-1)$ знакомый. Тем самым мы исключили вариант, когда у каждого находящегося в комнате свое, отличное от других, число знакомых. Иными словами, хотя бы для одного значения $k\in[0,n-1]$ в комнате нет человека с $k$ знакомыми, и количество различных значений для $k$ меньше числа $n$. Следовательно, согласно принципу Дирихле, хотя бы для двух из $n$ находящихся в комнате человек значение $k$ одно и то же.

Данная задача имеет многочисленные переформулировки. Например, если в комнату заходят $n$ человек, и кто-то с кем-то здоровается за руку, то существует по крайней мере два человека, которые пожали одинаковое количество рук. Или если в шахматном турнире участвуют $n$ человек, и любые два участника играют только по одной партии друг против друга, то в любой момент времени существует по меньшей мере два игрока, которые завершили одинаковое количество партий. С формальной же точки зрения все эти задачи равносильны утверждению о том, что в графе на $n$ вершинах хотя бы две вершины имеют одинаковую степень. 

\mysubitem Большое количество примеров на применение принципа Дирихле можно найти в разного рода геометрических задачах \cite{Prasolov}. Приведем достаточно характерный пример такого рода задач.

\begin{examp} В прямоугольнике со сторонами $6\times 8$ сантиметров помещены пять точек. Доказать, что существуют хотя бы две точки, расстояние между которыми меньше или равно пяти сантиметрам.
\end{examp}  

Действительно, поделим исходный прямоугольник на четыре равные части размерами $3\times 4$ сантиметра. Так как пять точек должны находиться либо внутри, либо на границах этих четырех прямоугольников, то, согласно принципу Дирихле, хотя бы две из них должны лежать либо внутри, либо на границах одного и того же прямоугольника. Осталось заметить, что расстояние между любыми такими точками меньше или равно пяти сантиметрам.

\mysubitem В заключение данного пункта приведем еще один интересный пример на принцип Дирихле, который предложили венгерские математики Эрдеш и Секереш.

\begin{examp}
Выделим в множестве $[2n]$ первых $2n$ целых положительных чисел подмножество $S\subset [2n]$ мощности $(n+1)$. Доказать, что в этом подмножестве существуют хотя бы два числа, одно из которых делит другое.
\end{examp}

Для решения данной задачи нужно догадаться, что любое число может быть представлено в виде
$$
2^r\cdot q,
$$
где $q$ есть нечетное число. Записав все числа из $S$ в таком виде, мы получим множество
$$
\{q_1,q_2,\ldots,q_{n+1}\},\qquad \qquad q_i\leq 2n
$$
нечетных чисел. Но в списке из $[2n]$ чисел только лишь $n$ нечетных, поэтому существуют такие $i\neq j$, что $q_i=q_j=q$. Как следствие, $S$ содержит пару чисел вида
$$
2^r\cdot q,\qquad \qquad 2^s\cdot q,
$$
и то число, у которого показатель двойки меньше, делит второе. 





\myitem При решении задач часто удобно использовать несложное обобщение принципа Дирихле. 

\mysubitem Именно, пусть у нас имеются $k$ объектов, которые мы должны распределить по $n<k$ ящикам. Тогда существует по крайней мере один ящик, в котором содержится не менее чем
$$
\lceil k/n\rceil
$$
предметов. Здесь $\lceil r\rceil$ --- ближайшее целое число, большее или равное $r=n/k$. 

В частном случае, когда $k=n+1$, имеем $r=(n+1)/n$, и поэтому $\lceil r\rceil=2$, то есть в одном ящике содержится хотя бы два предмета. Это --- классический случай Дирихле в его простейшей формулировке. 

Для формального доказательства данного утверждения достаточно предположить, что это не так. В этом случае в каждом ящике находится менее чем $\lceil k/n\rceil$ объектов. Как следствие, в любом ящике находится менее $k/n$ объектов. Поэтому всего в $k$ ящиках находится менее чем $k$ объектов, что противоречит условию нашего утверждения.

Часто в задачах нужно определить минимальное количество $k$ предметов, обеспечивающих наличие хотя бы $r$ предметов в одном из $n$ ящиков. Из обобщенного принципа Дирихле следует, что 
\begin{equation}
\label{eq:cons_TPH_principle}
k=n\cdot(r-1)+1.
\end{equation}

\mysubitem В качестве примера рассмотрим следующую задачу.

\begin{examp}[Эрдеш, Секереш]
Доказать, что любая последовательность из $n^2+1$ целых чисел содержит либо убывающую, либо возрастающую подпоследовательность, состоящую из не менее чем $(n+1)$-го числа.
\end{examp}

Для доказательства данного утверждения введем количество $s_i$ чисел в самой длинной возрастающей подпоследовательности, начинающейся с $a_i$. Например, для последовательности чисел 
$$
\{a_1,a_2,a_3,a_4,a_5\}=\{1,5,3,2,4\}\qquad \qquad s_1=3,\,s_2=1,\,s_3=2,\,s_4=2,\,s_5=1.
$$
Сразу заметим, что если существует такое $i$, что $s_i\geq (n+1)$, то процесс завершен. В нашем случае $s_1=3=(2+1)$, и поэтому в нашем случае все в порядке --- эта последовательность содержит возрастающую подпоследовательность $\{1,3,4\}$ длины три. Для подпоследовательности же 
$$
\{a_1,a_2,a_3,a_4,a_5\}=\{1,5,4,3,2\}\qquad \qquad s_1=2,\,s_2=1,\,s_3=1,\,s_4=1,\,s_5=1,
$$
и такого $i$ не существует. Иными словами, в этом случае все $(n^2+1)$ штук $s_i$ принимают значения из диапазона $[1,n]$. Тогда, согласно обобщенному принципу Дирихле, существует по крайней мере
$$
\left\lceil \dfrac{n^2+1}{n}\right\rceil=n+1
$$
чисел $s_i$, значения которых одинаковы и равны $s$. Все, что нам осталось понять --- это то, что соответствующая этим значениям $s$ подпоследовательность чисел $a_i$ является убывающей. 

Действительно, предположим, что в этой последовательности существует такая пара индексов $(i,j)$, что $j>i$ и $a_j>a_i$. Напомним, что по определению числа $s_j$, возрастающая подпоследовательность чисел, начинающаяся с $a_j$ имеет длину $s_j=s$. Добавляя $a_i$ в начало этой подпоследовательности, мы получим возрастающую последовательность длины $s+1$, начинающуюся с $a_i$. Это, в свою очередь, противоречит тому, что наибольшая числовая возрастающая последовательность, начинающаяся с $a_i$, имеет длину, равную $s$.




\section*{Упражнения}


\begin{exerc} В ящике лежат десять белых и двенадцать черных носков. Какое минимальное количество носков нужно вытащить, чтобы на выходе гарантированно получить пару носков одинакового цвета?
\end{exerc}

\begin{exerc} Внутри равностороннего треугольника со стороной в один сантиметр расположено пять точек. Доказать, что расстояние между хотя бы двумя из них меньше $0.5$ сантиметрам.
\end{exerc}

\begin{exerc} Какое максимальное количество королей можно поместить на шахматную доску (стандартного размера, $8 \times 8$) так, чтобы эти короли не били друг друга?
\end{exerc}


\begin{exerc} Узлы бесконечной клетчатой бумаги покрашены в два цвета. Доказать, что существуют две горизонтальные и две вертикальные прямые, на пересечениях которых лежат точки, покрашенные в один и тот же цвет.
\end{exerc}

\begin{exerc} На плоскости нарисовано $n$ попарно непараллельных прямых. Доказать, угол между по крайней мере двумя из этих прямых меньше или равен величине $\pi/n$. 
\end{exerc}

\begin{exerc} В ресторане имеется $14$ столов и $170$ стульев. Мы как-то расставляем стулья вокруг столов, а затем выбираем стол с максимальным количеством стульев за ним. Каково минимально возможное значение этого максимума?  
\end{exerc}

\begin{exerc} Сколько людей нужно выбрать из группы, состоящей из двадцати супружеских пар, чтобы в выборку гарантированно вошла хотя бы одна супружеская пара?  
\end{exerc}

\begin{exerc} Сколько человек должно находиться в комнате, чтобы по крайней мере у троих из них день рождения был в одном месяце?  
\end{exerc}

\begin{exerc} Сколько чисел нужно выбрать из последовательности
$$
\{1,2,3,\ldots,20\},
$$  
чтобы хотя бы два из них давали в сумме число $21$?
\end{exerc}

\begin{exerc} Внутри единичного квадрата разбросано десять точек. Доказать, что существуют хотя бы две из них, которые расположены ближе, чем $0.48$, и хотя бы три из них, которые покрываются кругом, радиус которого равен $0.5$.  
\end{exerc}

\begin{exerc} 
Внутри единичного куба расположены 100 точек. Доказать, что найдётся 4 точки, таких, что порождённый ими тетраэдр имеет объём не больше $1/99$.
\end{exerc}

\begin{exerc} 
Имеется 20 различных натуральных чисел, меньших 70. Доказать, что среди попарных разностей этих чисел имеется по крайней мере четыре одинаковых.
\end{exerc}



\section*{Решение упражнений}

\begin{sol_exerc} Нужно вытащить трое носков. Действительно, в группе из трех носков, по принципу Дирихле, должно быть хотя бы два носка одного цвета.
\end{sol_exerc}

\begin{sol_exerc} Соединяя между собой середины соседних сторон, мы разбиваем треугольник на четыре равные части. Для доказательства приведенного в упражнении утверждения осталось понять, что в случае попадания двух точек на границу или внутрь одного из таких треугольников расстояние между этими точками окажется меньше $0.5$ сантиметров.
\end{sol_exerc}

\begin{sol_exerc} Легко расставить 16 королей: например, можно в каждую белую клетку, стоящую в чётном ряду, поместить по королю. Докажем, что больше — нельзя. Разобьем доску на 16 квадратов $2 \times 2$ клетки. При расстановке 17-ти или большего числа королей хотя бы в одном таком квадрате будут стоять два короля. По условию такая ситуация невозможна, так как эти короли будут бить друг друга.
\end{sol_exerc}

\begin{sol_exerc} Возьмем любые три вертикальные и девять горизонтальных прямых и докажем, что среди них обязательно найдутся нужные нам две горизонтальные и две вертикальные прямые. Действительно, имеется $2^3=8$ различных вариантов раскраски любых трех точек в два цвета. Поэтому, согласно принципу Дирихле, среди девяти горизонтальных прямых, проходящих через девять троек точек, расположенных на трех вертикальных прямых, обязательно встретятся хотя бы две с одинаково раскрашенными точками. Но, согласно тому же принципу, среди трех точек, раскрашенных в два цвета, найдутся хотя бы две, окрашенные в один цвет. Тогда вертикальные прямые, проходящие через эти точки, вместе с ранее выбранными двумя горизонтальными прямыми, и образуют искомый прямоугольник. 
\end{sol_exerc}

\begin{sol_exerc} Возьмем на плоскости произвольную точку $A$ и проведем через нее прямые, параллельные указанным в условии задачи. Эти прямые разделяют плоскость на $2n$ секторов, сумма углов которых равна $360^\circ$. Поэтому вариант, когда все углы больше $360^\circ/2n=180^\circ/n$, невозможен --- величина одного из них обязательно должна быть меньше $180^\circ/n$.  
\end{sol_exerc}

\begin{sol_exerc} Понятно, что максимальное значение равно $170$. Для поиска минимального значения этого максимума воспользуемся обобщенным принципом Дирихле. Столы можно трактовать как ящики, стулья --- предметы. В этом случае, согласно обобщенному принципу Дирихле, будет обязательно существовать стол, вокруг которого расставлено $\lceil 170/14\rceil=13$ стульев. Это и будет ответ. 
\end{sol_exerc}

\begin{sol_exerc} Достаточно взять двадцать одного человека. Действительно, любую пару здесь нужно трактовать как ящик. Тогда, согласно формуле (\ref{eq:cons_TPH_principle}), $k=n\cdot(r-1)+1=20\cdot (2-1)+1=21$.  
\end{sol_exerc}

\begin{sol_exerc} У нас имеется $n=12$ месяцев и $r=3$ человека с днями рождения в одном и том же месяце. Из формулы (\ref{eq:cons_TPH_principle}) имеем $k=n\cdot(r-1)+1=12\cdot (3-1)+1=25$.  
\end{sol_exerc}

\begin{sol_exerc} Все множество этих чисел можно разбить на $10$ пар, сумма которых дает $21$:
$$
1+20=2+19=\ldots=10+11.
$$
Итак, имеется $10$ ящиков, и нужно, чтобы хотя бы в одном из них было хотя бы два предмета. Тогда, согласно (\ref{eq:cons_TPH_principle}), $k=n\cdot(r-1)+1=11$. 
\end{sol_exerc}

\begin{sol_exerc} Для доказательства первого утверждения достаточно разбить круг на девять квадратов равных частей и подсчитать длину диагонали одного такого квадрата. Для доказательства второго утверждения следует поделить квадрат диагоналями на четыре части. Тогда, согласно обобщенному принципу Дирихле, имеются хотя бы $\lceil 10/4\rceil=3$ точки внутри хотя бы одного из получившихся треугольников. Остается заметить, что все они попадают в круг радиуса $0.5$, центр которого находится на середине стороны квадрата, являющегося одной из сторон выбранного треугольника.
\end{sol_exerc}


\begin{sol_exerc}
Разобьём куб на 33 параллелепипеда равного объема плоскостями, параллельными одной из граней. По принципу Дирихле, хотя бы один из этих параллелепипедов будет содержать четыре точки из данных ста. Рассмотрим тетраэдр, построенный на этих точках. Его объем не превосходит $1/99$, так как тетраэдр, целиком содержащийся в параллелепипеде, имеет объем не более одной трети от объема параллелепипеда. 
\end{sol_exerc}

\begin{sol_exerc} 
Упорядочим данные 20 чисел по возрастанию и рассмотрим попарные разности соседних чисел. С одной стороны, сумма этих разностей не превосходит 69, а с другой, если среди них нет четырёх повторяющихся, их сумма должна быть не меньше $3\cdot 1 + 3 \cdot 2 + 3 \cdot 3 + 3 \cdot 4 + 3 \cdot 5 + 3 \cdot 6 + 7$, что равно 70. Противоречие.
\end{sol_exerc}





\section{Основные правила перечислительной комбинаторики}

\myitem Перейдем теперь к описанию простейших фактов, лежащих в основе перечислительной комбинаторики. Начнем с очень краткого напоминания основных понятий теории множеств.

\begin{defin}
Множеством $X=\{x_1,x_2,\ldots,x_n\}$ называется совокупность различимых объектов $x_i$, $i=1,\ldots,n$, объединенных по некоторому признаку.
\end{defin}

В качестве характерного примера можно рассмотреть, например, множество $X$ всех студентов, находящихся в данной аудитории. Действительно, все студенты различимы, отличны друг от друга и объединены по признаку ``собрались в данной аудитории''.


\begin{defin}
Мощностью $|X|$ множества $X$ называется количество элементов в нем. Как правило, мы будем рассматривать конечные множества, в которых $|X|=n$, $n\in\N$, и называть их $n$-множествами.
\end{defin}

\mysubitem Основные операции над множествами --- это объединение $A\cup B$, пересечение $A\cap B$ и разность $A\setminus B$ двух множеств $A$ и $B$. В случае, если множество $A$ является подмножеством некоторого более широкого множества $X$, удобно также рассматривать операцию дополнения $A':=X\setminus A$ множества $A$. 


\begin{figure}[h]
\centering

\begin{tabular}[t]{cc}

\\
	\begin{subfigure}[b]{0.45\textwidth}
	\centering
    		\includegraphics[scale=0.2]{pics/complement.eps}
 	\caption{Дополнение}
	\end{subfigure}

&


	\begin{subfigure}[b]{0.45\textwidth}
	\centering
    		\includegraphics[scale=0.2]{pics/intersection.eps}
 	\caption{Пересечение}
	\end{subfigure}
\\
\\
\\
	\begin{subfigure}[b]{0.45\textwidth}
	\centering
    		\includegraphics[scale=0.2]{pics/union.eps}
 	\caption{Объединение}
	\end{subfigure}


&
	\begin{subfigure}[b]{0.45\textwidth}
	\centering
    		\includegraphics[scale=0.2]{pics/difference.eps}
 	\caption{Разность}
	\end{subfigure}
\end{tabular}
\caption{Простейшие операции над множествами}
\label{fig:basic_set_oper}
\end{figure}


Свойства операций над множествами удобно изучать графически, с использованием так называемых \emph{диаграмм Эйлера-Венна} (смотри рис.\ref{fig:basic_set_oper}). Например, с их помощью достаточно просто проиллюстрировать справедливость законов де Моргана
\begin{equation}
\label{eq:de_Morgan_lows}
A'\cap B'=(A\cup B)',\qquad \qquad\qquad A'\cup B'=(A\cap B)'
\end{equation}
(смотри рис.\ref{fig:de_morgan_law}).


\begin{figure}[h]
\centering
  \includegraphics[scale=0.2]{pics/complement_intersection_eq.eps}
\caption{Графическое доказательство закона де Моргана}
\label{fig:de_morgan_law}
\end{figure}

\mysubitem В дальнейшем мы достаточно часто будем использовать понятие покрытия множества $X$ семейством $\{X_1,X_2,\ldots,X_k\}$ множеств, а также всевозможные частные случаи этого понятия. 

\begin{defin} Семейство множеств $\{X_1,X_2,\ldots,X_k\}$ называется \emph{покрытием} множества $X$, если их объединение дает нам все множество $X$:
$$
X_1\cup X_2\cup\ldots \cup X_k=X.
$$
\end{defin}

Важным частным случаем покрытия является понятие разбиения множества.

\begin{defin} Говорят, что семейство множеств $\{X_1,X_2,\ldots,X_k\}$ образует \emph{разбиение} множества $X$, если
\begin{enumerate}
\item множества $X_i\neq \emptyset$, $i=1,\ldots,n$;
\item $X_i\cap X_j=\emptyset$ $\forall i\neq j$;
\item $X_1\cup X_2\bigcup\ldots \cup X_k=X$.
\end{enumerate}
Элементы $X_i$ этого семейства называются \emph{блоками} разбиения.
\end{defin}

В качестве характерного примера можно рассмотреть разбиение студентов данного курса на группы. Студенческие группы являются при этом блоками данного разбиения.

Если по каким-то причинам оказывается важным порядок следования блоков, то говорят об \emph{упорядоченном разбиении} $(X_1,X_2,\ldots,X_k)$ множества $X$. Например, если мы выводим группы на сцену для вручения им дипломов, то важен порядок, в котором они туда выходят. Следовательно, в данном случае мы получаем упорядоченное разбиение студентов данного курса.

Наконец, еще одним частным случаем покрытия $X$ семейством множеств $\{X_1,X_2,\ldots,X_k\}$
является понятие \emph{разделения} множества $X$. Разделение есть аналог упорядоченного разбиения, в
котором допускаются пустые блоки. Точное определение таково:

\begin{defin} Разделением множества $X$ называется упорядоченная последовательность $(X_1,X_2,\ldots,X_k)$ возможно пустых, попарно непересекающихся множеств, объединение которых дает все множество $X$.
\end{defin}

\mysubitem Еще одной часто использующейся в комбинаторике операцией над множествами является операция декартова произведения множеств. 

\begin{defin} Декартовым произведением множеств $A$ и $B$ называется множество
$$
A\times B:=\{(a,b)\,|\,a\in A, \,\,b\in B\}
$$
всех упорядоченных пар $(a,b)$, таких, что $a\in A$, $b\in B$.
\end{defin}

В качестве простейшего примера декартова произведения множеств обычно приводят шахматную доску.
Любая клетка шахматной доски имеет координаты ``буква-цифра'', например, $e5$ или $h4$. Иными
словами, координаты клеток шахматной доски являются элементами декартова произведения множеств
$A=\{a,b,\ldots,h\}$ и $B=\{1,2,\ldots,8\}$.

В частном случае множества $A$ и $B$ могут совпадать. В этом случае декартово произведение $A\times A$ обозначается через $A^{(2)}$.

\begin{defin} Декартовым произведением $k$ множеств $X_1,X_2,\ldots,X_k$ называется множество
$$
X_1\times X_2\times\ldots\times X_k:=\{(x_1,x_2,\ldots,x_k)\,|\,x_i\in X_i, \,\,\forall \,\,i=1,\ldots,k\}
$$
всевозможных упорядоченных $k$-элементных последовательностей вида $(x_1,x_2,\ldots,x_k)$.
\end{defin}

В частном случае $X_1=X_2=\ldots=X_k=X$ имеем декартову степень $X\times X\times\ldots\times X=:X^{(k)}$. 

\mysubitem Любой элемент $X^{(k)}$ есть упорядоченный набор из $k$ элементов множества $X$, в котором некоторые элементы могут повторяться. Если же в таком $k$-множестве порядок элементов не важен, говорят о \emph{$k$-мультимножестве над множеством $X$.} Формальное определение $k$-мультимножества таково.

\begin{defin}
$k$-мультимножеством над $n$-элементным множеством $X$ называется пара $(X,\phi)$, где $\phi\colon X\to \Z_+$ есть функция, сопоставляющая любому элементу $x\in X$ количество $\phi(x)$ его вхождений в $k$-мультимножество. 
\end{defin}

Любую функцию $\phi$ такого рода можно определить с помощью множества $\Xi$ упорядоченных пар 
$$
\Xi:=\{(x,\phi(x))\mid x\in X\}. 
$$
Поэтому, например, $3$-мультимножество над множеством $X=\{x,y\}$, состоящее из двух элементов $x$ и одного элемента $y$, можно формально записывать в виде $(X,\{(x,2),(y,1)\})$. Однако чаще вместо такой формальной записи используют более наглядную форму записи вида $\{x,x,y\}$. 

Самый простой и понятный пример мультимножества --- это монеты в кошельке. В этом примере в качестве множества $X$ выступает множество из девяти монет разного достоинства:
$$
X=\{\mbox{1 копейка, 5 копеек, 10 копеек, 50 копеек, 1 рубль, 2 рубля,
5 рублей, 10 рублей}\}.
$$
Любой набор из этих монет в количестве $k$ штук образует $k$-мультимножество над множеством
$X.$ 

\mysubitem Теория множеств как раздел математики создавалась значительно позже комбинаторики. Поэтому некоторые наиболее важные понятия теории множеств исторически получили в комбинаторике свои, специфические названия. Именно,
\begin{enumerate}
\item $k$-сочетанием без повторений называется любое $k$-элементное подмножество $n$-эле\-мент\-ного множества;
\item $k$-сочетанием с повторениями называется любое $k$-мультимножество над $n$-множеством;
\item $k$-перестановкой без повторений называется упорядоченное $k$-подмножество $n$-эле\-мент\-ного множества;
\item $k$-перестановкой с повторениями называется любой элемент декартовой степени $X^{(k)}$.
\end{enumerate}


\myitem Теперь перейдем к двум самым простым, но в то же время достаточно важным правилам перечислительной комбинаторики --- правилу суммы и правилу произведения.

\mysubitem Начнем с простейшего примера: пусть на одном блюде лежат три яблока, а на втором --- две груши; сколькими способами можно выбрать один фрукт? Ответ очевиден: пятью способами.

Обобщающее этот пример простейшее \emph{правило суммы} можно сформулировать так: если некоторый объект из множества $A$ можно выбрать $k$ способами, и, вне зависимости от выбора этого объекта, можно $n$ способами
выбрать некоторый элемент множества $B$, то выбор объекта из множества $A$ \emph{или} из
множества $B$ можно осуществить $k+n$ способами.

Очевидна переформулировка этого правила на языке теории множеств: пусть пересечение двух множеств $A$ и $B$ пусто; тогда
$$
|A\cup B|=|A|+|B|.
$$
В частности, если $A\subset X$ и $A'$ --- дополнение множества $A$, то
\begin{equation}
\label{eq:A_compl_A}
|A|+|A'|=|X|.
\end{equation}

В более общем случае, рассматривая произвольное разбиение множества $X$ на блоки, имеем равенство вида
$$
|X|=|X_1|+|X_2|+\ldots+|X_k|,
$$
которое также называется правилом суммы в комбинаторике.

\mysubitem Под правилом произведения в комбинаторике понимается равенство
$$
|X_1\times X_2\times\ldots\times X_k|=|X_1|\cdot|X_2|\cdot\ldots\cdot|X_k|.
$$

Приведем простейший пример на применение этого правила в комбинаторике. Пусть в аудитории находятся $32$ студента одной группы, $24$ студента другой группы и $17$ студентов третьей группы. В этом случае тройку, состоящую из представителей каждой группы, можно выбрать $32\cdot 24\cdot 17$ способами. 

\myitem Наряду с правилом суммы, в элементарной комбинаторике также достаточно часто используется и несложное его обобщение --- так называемый \emph{принцип включения-исключения}. Если правило суммы связано с разбиением множества $X$, то принцип включения-исключения связан с некоторым произвольным покрытием этого $n$-множества семейством $\{X_1,X_2,\ldots,X_k\}$. Сформулируем его для самого простого случая двух множеств.

\mysubitem Рассмотрим два конечных множества $A$ и $B$, пересечение которых может быть и непусто. Тогда
количество элементов в объединении этих множеств, очевидно, равно
\begin{equation}
\label{eq:pr_sum_tot_2}
|A\cup B|=|A|+|B|-|A\cap B|.
\end{equation}
Действительно, когда мы считаем количество $|A|$ элементов в множестве $A$ и складываем его с количеством $|B|$ элементов в множестве $B$, мы любой элемент, принадлежащий как множеству $A$, так и множеству $B$, считаем дважды. Чтобы этот избыток убрать, нам нужно один раз вычесть количество элементов, содержащихся в пересечении этих двух множеств.

Равенство (\ref{eq:pr_sum_tot_2}) можно называть обобщенным правилом суммы --- оно обобщает правило суммы на случай, когда пересечение двух множеств не пусто.

\mysubitem Предположим теперь, что $A$ и $B$ являются подмножествами некоторого более широкого множества $X$. В этом случае у множества $A\subset X$ и множества $B\subset X$ имеются дополнения к ним --- множества $A'$ и $B'$, причем $A\cup A'=B\cup B'=X$. 

Рассмотрим теперь пересечение $A'\cap B'$ дополнений множеств $A$ и $B$. Согласно одной из теорем де Моргана (\ref{eq:de_Morgan_lows}), $ A'\cap B'=(A\cup B)'$. Следовательно, количество элементов в этом пересечении с учетом равенства (\ref{eq:A_compl_A}) и обобщенного правила суммы (\ref{eq:pr_sum_tot_2}) можно сосчитать так:
$$
|A'\cap B'|=|(A\cup B)'|=|X|-|A\cup B|=|X|-|A|-|B|+|A\cap B|.
$$
Равенство
\begin{equation}
\label{eq:pr_vkl_iskl_2}
|A'\cap B'|=|X|-|A|-|B|+|A\cap B|,
\end{equation}
и называется в комбинаторике принципом включения-исключения.

\mysubitem Приведем простейший пример его использования. Пусть в аудитории находятся $30$ человек, $20$ человек из которых знают английский, $12$ --- французский, а $6$ человек знают оба языка. Сколько человек не знает ни один из этих иностранных языков? Ответ, согласно принципу включения-исключения (\ref{eq:pr_vkl_iskl_2}), следующий:
$$
N=30-20-12+6=4.
$$

\mysubitem Несложно обобщить равенства (\ref{eq:pr_sum_tot_2}) и (\ref{eq:pr_vkl_iskl_2}) на случай большего количества множеств. Например, для трех множеств $A$, $B$, $C$ соответствующие формулы выглядят так:

а) обобщенное правило суммы:
\begin{equation}
\label{eq:pr_sum_tot_3}
|A\cup B\cup C|=|A|+|B|+|C|-|A\cap B|-|A\cap C|-|B\cap C|+|A\cap B\cap C|;
\end{equation}

\begin{figure}[h]
\centering
 \includegraphics[scale=0.2]{pics/incl_excl_euler.eps}
 \caption{Диаграмма Эйлера-Венна для трёх множеств}
 \label{fig:incl_excl_euler}
 \end{figure}


б) принцип включения-исключения:
\begin{equation}
\label{eq:pr_vkl_iskl_3}
|A'\cap B'\cap C'|=|X|-|A|-|B|-|C|+|A\cap B|+|A\cap C|+|B\cap C|-|A\cap B\cap C|.
\end{equation}

Действительно, рассмотрим, к примеру, левую часть равенства (\ref{eq:pr_sum_tot_3}). Она подсчитывает количество элементов, принадлежащих объединению трех множеств (смотри рис.\ref{fig:incl_excl_euler}). Если элемент $x_1$, принадлежащий этому объединению, содержится в множестве $A$, но не содержится в множествах $B$ и $C$, то он один раз подсчитывается в правой части равенства (\ref{eq:pr_sum_tot_3}) (слагаемое $|A|$, отвечающее зеленой подобласти на рис.\ref{fig:incl_excl_euler}). Если элемент $x_2$ принадлежит множествам $A$ и $B$, но не принадлежит $C$ (красная подобласть на рис.\ref{fig:incl_excl_euler}), то в правой части (\ref{eq:pr_sum_tot_3}) этот элемент входит в слагаемые $|A|$, $|B|$ и $-|A\cap B|$, то есть также подсчитывается ровно один раз. Наконец, если $x_3$ принадлежит пересечению всех трех множеств (зеленая подобласть на рис.\ref{fig:incl_excl_euler}), то за этот элемент отвечают все слагаемые в правой части (\ref{eq:pr_sum_tot_3}). Так как четыре из них входят со знаком плюс, а три --- со знаком минус, то этот элемент также считается в правой части (\ref{eq:pr_sum_tot_3}) лишь однажды. 

\section*{Упражнения}

\begin{exerc} 
Имеются пять видов конвертов без марок и четыре вида марок. Сколькими способами можно выбрать конверт с маркой для посылки письма?
\end{exerc}

\begin{exerc} 
Сколько чисел в диапазоне от $0$ до $999\,999$ не содержат двух рядом стоящих одинаковых цифр?
\end{exerc}

\begin{exerc} 
Сколько существует целых чисел между $0$ и $999$, содержащих ровно одну цифру $7$?
\end{exerc}

\begin{exerc} 
Сколько существует целых чисел между $0$ и $999$, содержащих хотя бы одну цифру $7$? 
\end{exerc}

\begin{exerc} 
Сколько целых чисел от $1$ до $999$ не делится ни на два, ни на три, ни на пять?
\end{exerc}

\begin{exerc} 
Доказать следующую двойственную к (\ref{eq:pr_sum_tot_3}) формулу:
$$
|A\cap B\cap C|=|A|+|B|+|C|-|A\cup B|-|A\cup C|-|B\cup C|+|A\cup B\cup C|.
$$
\end{exerc}

\begin{exerc} 
Сколькими способами можно выбрать на шахматной доске два поля, не лежащие на одной горизонтали или вертикали?
\end{exerc}

\begin{exerc} 
Сколько существует целых чисел от $0$ до $9\,999\,999$, в записи которых встречается единица? 
\end{exerc}

\begin{exerc} 
Переплётчик должен переплести $12$ книг в красный, синий и коричневый цвета. Сколько имеется способов это сделать, если в каждый из трех цветов должна быть переплетена хотя бы одна книга?
\end{exerc}

\begin{exerc} 
Квадрат разделён на $16$ одинаковых квадратов. Сколькими способами можно раскрасить эти квадраты в белый, чёрный, красный и синий цвета так, чтобы в каждом горизонтальном и каждом вертикальном ряду были все четыре цвета? 
\end{exerc}




\section*{Решение упражнений}

\begin{sol_exerc}
Согласно правилу произведения, $|X|=|X_1|\cdot |X_2|=5\cdot 4=20$, где $X_1$ есть множество различных видов конвертов, а $X_2$ --- множество различных видов марок.
\end{sol_exerc}

\begin{sol_exerc}
Разобъем все множество $X$ этих чисел на блоки $X_i$, $i=1,\ldots,6$ в зависимости от количества цифр в данном числе. Ясно, что $|X_1|=10$. В остальных блоках на любую позицию мы можем поставить любую из девяти цифр: на первую позицию --- любую цифру от $1$ до $9$, а на каждую последующую --- любую из цифр, не совпадающую с предыдущей. Поэтому, согласно правилу суммы и правилу произведения,
$$
|X|=10+9^2+9^3+\ldots +9^6=\sum\limits_{i=0}^6 9^i=\dfrac{9^7-1}{9-1}=597\,871.
$$
\end{sol_exerc}

\begin{sol_exerc}
Пусть $X$ есть множество искомых чисел. Нам нужно сосчитать его мощность. Для этого разобъем $X$ на следующие блоки:
\begin{enumerate}
\item $X_1$ --- числа, состоящие из одной цифры;
\item $X_2$ --- числа, состоящие из двух цифр;
\item $X_3$ --- числа, состоящие из трех цифр.
\end{enumerate}
Очевидно, $|X_1|=1$. Сосчитаем мощность второго блока. Для этого разобъем его, в свою очередь, на два подблока: подблок $X_2^{(1)}$, содержащий семерку в первой позиции, и подблок $X_2^{(2)}$, содержащий ее во второй позиции. В первом подблоке содержатся следующие числа:
$$
X_2^{(1)}=\{70,71,\ldots,76,78,79\}\qquad\Longrightarrow\qquad |X_2^{(1)}|=9.
$$ 
Второй подблок состоит из чисел
$$
X_2^{(2)}=\{17,27,\ldots,67,87,97\}\qquad\Longrightarrow\qquad |X_2^{(2)}|=8.
$$

Для подсчета $|X_3|$ также разобъем блок $X_3$ на три подблока $X_3^{(i)}$, $i=1,2,3$, в зависимости от того, на каком месте стоит цифра семь. В подблоке $X_3^{(1)}$ семерка должна стоять на первой позиции, а на остальных позициях могут находиться любые цифры от $0$ до $9$. Поэтому $|X_3^{(1)}|=9\cdot 9=81$. В подблоке $X_3^{(2)}$ цифра $7$ стоит на второй позиции. При этом на первой позиции стоит любая цифра из множества $\{1,2,\ldots,6,8,9\}$, а на последней --- любая цифра, отличная от семи. Следовательно, $|X_3^{(2)}|=8\cdot 9=72$. Мощность подблока $X_3^{(3)}$ считается аналогично, поэтому
$$
|X_3|=81+72+72=225\qquad\Longrightarrow\qquad |X|=1+17+225=243.
$$
\end{sol_exerc}

\begin{sol_exerc}
Легче всего данную задачу решать, используя подход, обычно называемый ``плохой -- хороший'': 
\begin{equation}
\label{eq:good_bad}
\text{количество хороших объектов}=\text{количество всех объектов}-\text{количество плохих объектов.}
\end{equation}
В данной задаче всего имеется $1000$ чисел. Осталось понять, сколько существует чисел в заданном диапазоне, не содержащих цифру $7$. А это сосчитать уже легко. Действительно, любое такое число можно записать в виде набора из трех цифр, принадлежащих множеству $\{0,1,\ldots,6,8,9\}$. Поэтому количество таких чисел равно $9\cdot 9\cdot 9=729$. Следовательно, согласно принципу ``плохой -- хороший'', имеем
$$
|X|=1000-729=271.
$$
\end{sol_exerc}

\begin{sol_exerc}
Для решения данной задачи воспользуемся принципом включения-исключения (\ref{eq:pr_vkl_iskl_3}). Пусть $X_2$, $X_3$ и $X_5$ --- множества чисел из заданного диапазона, делящихся на двойку, тройку и пятерку. Ясно, что 
$$
|X_i|=\left\lfloor|X|/i\right\rfloor,
$$
где $|X|=100$, $\lfloor p \rfloor$ --- целая часть числа $p$. Поэтому $|X_2|=50$, $|X_3|=33$, а $|X_5|=20$. Далее, $X_2\cup X_3$ --- это множество чисел, делящихся на шестерку. Следовательно,
$$
|X_2\cup X_3|=\left\lfloor|X|/6\right\rfloor=16. 
$$
Аналогично,
$$
|X_2\cup X_5|=\left\lfloor|X|/10\right\rfloor=10,\qquad |X_3\cup X_5|=\left\lfloor|X|/15\right\rfloor=6,\qquad 
|X_2\cup X_3\cup X_5|=\left\lfloor|X|/15\right\rfloor=3,
$$
и поэтому 
$$
|X'_2\cap X'_3\cap X'_5|=100-50-33-20+16+10+6-3=26.
$$
\end{sol_exerc}

\begin{sol_exerc}
Действительно, формулу (\ref{eq:pr_sum_tot_3}) можно переписать следующим образом:
$$
|A\cap B\cap C|=|A\cup B\cup C|-|A|-|B|-|C|+|A\cap B|+|A\cap C|+|B\cap C|.
$$
Учитывая теперь, что
$$
|A\cap B|=|A|+|B|-|A\cup B|,\qquad |A\cap C|=|A|+|C|-|A\cup C|,\qquad |B\cap C|=|B|+|C|-|B\cup C|,
$$
мы и получаем требуемое равенство.
\end{sol_exerc}


\begin{sol_exerc}
Первое поле можно выбрать $64$-мя способами, а второе — $49$-ю. По правилу произведения, общее количество способов равно $64\cdot49$, однако для получения окончательного ответа это число нужно разделить на два, так как каждая пара полей была посчитана два раза. 

\answer $32\cdot49$.
\end{sol_exerc}

\begin{sol_exerc}
Для решения задачи воспользуемся подходом (\ref{eq:good_bad}). Для этого вычтем из общего количества чисел, равного $10\,000\,000$, количество тех чисел, в записи которых единица отсутствует. Каждое такое число можно получить, выбирая независимо каждый из семи разрядов. Сделать это можно, согласно правилу произведения, $9^7$ способами (выбираем лишь из девяти цифр: единицу выбирать нельзя).  Заметим, что при таком подходе не нужно отдельно рассчитывать количество чисел для каждого фиксированного числа разрядов, так как мы допустили возможность выбирать ведущие нули.

\answer $10\,000\,000-9^7$.
\end{sol_exerc}

\begin{sol_exerc}
Вычислить количество способов переплёта, в которых данные цвета присутствуют, не очень просто. Однако достаточно легко получить выражения для количества способов переплёта, в которых данный набор цветов, напротив, отсутствует. Например, если мы знаем, что красный цвет нельзя использовать, то способов переплести книги остаётся, по правилу произведения, $2^{12}$. Иными словами, в данной задаче удобно воспользоваться принципом включения-исключения. 

Пусть $X$ — все способы переплести книги, $A, B, C$ — те способы, при которых не используется красный, синий, коричневый цвет, соответственно. Искомое количество способов переплёта равно $|A'\cap B'\cap C'|$. По формуле включения-исключения, это количество равно
$$
|X|-|A|-|B|-|C|+|A\cap B|+|A\cap C|+|B\cap C|-|A\cap B\cap C| = 3^{12}-3\cdot 2^{12}+3 \cdot 1^{12}-0.
$$

\answer $519156$.
\end{sol_exerc}

\begin{sol_exerc}
Для удобства обозначим цвета числами $1,2,3,4$. Зафиксируем следующее расположение цветов в первом горизонтальном ряду: $1,2,3,4$. Переставим горизонтальные ряды со второго по четвёртый так, чтобы в первом вертикальном ряду цвета были упорядочены точно таким же образом: $1,2,3,4$. После этого остаётся $4$ способа расставить числа в оставшихся девяти клетках (разместим вначале единицы; из шести спобосов сделать это подойдут только те, в которых единицы расположены симметрично относительно диагонали). Каждая раскраска квадрата получается из одной из этих четырёх сначала произвольным упорядочиванием горизонтальных рядов со второго по четвёртый (6 способов), а после этого произвольным назначением числам от 1 до 4 различных названий цветов (4! способов). По правилу произведения получаем общее количество способов, равное $4\cdot 6 \cdot4!=576$.
\end{sol_exerc}






\section{k-сочетания из $n$ элементов. Биномиальные коэффициенты.}

\myitem В качестве первого важного примера на применение описанных в первом параграфе правил сосчитаем
количество $k$-сочетаний без повторений из $n$ элементов. Количество таких $k$-сочетаний при произвольных $n$ и $k$ носит название биномиальных коэффициентов. Ранее в советской литературе они обозначались через $C_n^k$. В настоящее время для этих коэффициентов используется обозначение $\binom{n}{k}$ (читается ``из $n$ по $k$'').

\mysubitem Обычно на вопрос, чему равны биномиальные коэффициенты, вспоминают формулу
$$
\binom{n}{k}=\dfrac{n!}{k!\,(n-k)!}.
$$
В следующем параграфе мы получим более точное выражение для этих коэффициентов, позволяющее обобщить данное понятие на случай целых, вещественных и даже комплексных значений $n$. Сейчас же мы с помощью правила суммы выведем рекуррентное соотношение для биномиальных коэффициентов.

\mysubitem Введем множество $\Sigma_k$ всех $k$-элементных подмножеств $n$-элементного множества $X$. Например, для $X=\{x_1,x_2,x_3\}$ множество $\Sigma_2=\{\{x_1,x_2\},\{x_1,x_3\},\{x_2,x_3\}\}$. Разобьем $\Sigma_k$ на два блока --- блок $\Sigma_k^{(1)}$, $k$-элементные подмножества которого содержат элемент $x_1$, и блок $\Sigma_k^{(2)}$, подмножества которого этот элемент не содержат. Понятно, что это --- непустые, непересекающиеся подмножества, объединение которых дает нам все множество $\Sigma_k$. Поэтому по правилу суммы
$$
\BCf{n}{k}=|\Sigma_k|=|\Sigma_k^{(1)}|+|\Sigma_k^{(2)}|.
$$
Осталось выразить через биномиальные коэффициенты количество элементов в каждом из блоков $\Sigma_k^{(1)}$, $\Sigma_k^{(2)}$. А это делается довольно легко.

\mysubitem Действительно, во всех подмножествах первого блока элемент $x_1$ уже выбран, и нам остается выбрать $(k-1)$-элементные подмножества из $(n-1)$-элементного множества $X\setminus x_1$. Сделать это можно ${n-1}\choose {k-1}$ способами. Во втором блоке содержатся $k$-элементные подмножества множества $X\setminus x_1$, состоящего из $(n-1)$-го элемента. Их количество, очевидно, равно ${n-1}\choose k$. Таким образом окончательно имеем следующее рекуррентное соотношение:
\begin{equation}
\label{eq:binom_recur}
\binom{n}{k}={{n-1}\choose {k-1}}+{{n-1}\choose k},\qquad k\geq 1,\quad n\geq 1.
\end{equation}

\mysubitem Соотношение (\ref{eq:binom_recur}) следует дополнить начальными и граничными условиями. Так как $k$-элементных подмножеств $n$-элементного множества в случае $k>n$ не существует, то
$$
{n \choose k}=0\qquad \mbox{при} \quad k>n.
$$
Далее, пустое подмножество можно выбрать всегда и только одним способом; поэтому
$$
{n \choose 0}=1\qquad \forall \,\,n\geq 0.
$$
Используя эти условия, можно шаг за шагом вычислить коэффициенты $n \choose k$. Часто их записывают в виде так называемого треугольника Паскаля:
\begin{gather*}
1\\
1\phantom{000}1\\
1\phantom{000}2\phantom{000}1\\
1\phantom{000}3\phantom{000}3\phantom{000}1\\
1\phantom{000}4\phantom{000}6\phantom{000}4\phantom{000}1\\
\ldots
\end{gather*}

\mysubitem Как видно, треугольник Паскаля симметричен, т.е. ${n\choose k}={n\choose {n-k}}$. Комбинаторное доказательство этого факта очевидно. Действительно, выбирая любое $k$-элементное множество, мы тем самым однозначно выбираем и дополнение к нему, т.е. $(n-k)$-элементное множество. Следовательно, количество $k$-элементных и $(n-k)$-элементных подмножеств совпадает.

\begin{figure}[h]
\centering
  \includegraphics[scale=0.5]{pics/pascal_triangle_2.eps}
\caption{Графическое представление чисел $\binom{n}{k}$ на координатной плоскости $(n,k)$}
\label{fig:binom_graphic}
\end{figure}


\mysubitem Наряду с треугольником Паскаля удобно также пользоваться и другим графическим представлением чисел $n\choose k$. Именно, рассмотрим координатную плоскость $(n,k)$, и в точках с координатами $(n,k)$, $n\geq 0$, $k=0,\ldots,n$ отметим числа $n\choose k$ (смотри рис.\ref{fig:binom_graphic}).
В таком представлении числа $n\choose k$ можно трактовать как количество различных путей, состоящих из диагональных $(1,1)$ и вертикальных  $(1,0)$ отрезков, выходящих из начала координат --- точки $(0,0)$, и оканчивающихся в точке с координатами $(n,k)$. Заметим, что в точку с координатами $(n,k)$ мы можем попасть только из точек с координатами $(n-1,k-1)$ и $(n-1,k)$. Как следствие, рекуррентное соотношение (\ref{eq:binom_recur}) в данном представлении можно трактовать следующим образом: количество путей в точку с координатами $(n,k)$ складывается из количества путей, приходящих в точку с координатами $(n-1,k-1)$, и из количества путей, приходящих в точку с координатами $(n-1,k)$.



\myitem В качестве следующего применения правила суммы в комбинаторике докажем следующее важное тождество для коэффициентов $n\choose k$ --- формулу суммирования по верхнему индексу:
\begin{equation}
\label{eq:sum_high_index_bin_coeff}
\sum\limits_{m=0}^n {m\choose k}=
\underbrace{{0\choose k}+{1\choose k}+\ldots+{k-1\choose k}}_{\phantom{00}=0}+{k\choose k}+
{{k+1}\choose k}+\ldots+{n\choose k}=
\sum\limits_{m=k}^n {m\choose k}=\BCf{n+1}{k+1}.
\end{equation}

\mysubitem Для формального доказательства этого тождества применим рекуррентное соотношение (\ref{eq:binom_recur}) к коэффициенту ${m+1}\choose {k+1}$:
$$
{{m+1}\choose {k+1}}={m \choose k}+{m\choose {k+1}}\qquad \Longrightarrow \qquad
{m \choose k}={{m+1}\choose {k+1}}-{m\choose {k+1}}
$$
Просуммируем теперь полученное равенство по $m$ от $k$ до $n$:
\begin{align*}
\sum\limits_{m=k}^n {m\choose k}&=\BCf{n+1}{k+1}+\sum\limits_{m=k}^{n-1} {{m+1}\choose {k+1}}-
\sum\limits_{m=k}^n{m\choose {k+1}}=\\
&=\BCf{n+1}{k+1}+\sum\limits_{m=k}^{n-1} {{m+1}\choose {k+1}}-
\sum\limits_{m=k+1}^n{m\choose {k+1}}=\\
&=\BCf{n+1}{k+1}+\sum\limits_{m'=k+1}^{n} {{m'}\choose {k+1}}-
\sum\limits_{m=k+1}^n{m\choose {k+1}}=\BCf{n+1}{k+1}.
\end{align*}

\mysubitem Комбинаторное доказательство тождества (\ref{eq:sum_high_index_bin_coeff}) основано на следующем общем подходе: мы разбиваем множество $\Sigma_{k+1}$ всех $(k+1)$-элементных подмножеств $(n+1)$-элементного множества $X=\{x_1,x_2,\ldots,x_{n+1}\}$ на блоки, подсчитываем количество элементов в каждом блоке, а затем пользуемся правилом суммы для подсчета числа $|\Sigma_{k+1}|=\BCf{n+1}{k+1}$.

Разбиение множества $\Sigma_{k+1}$ будем проводить следующим образом. В первый блок разбиения мы включим все $(k+1)$-элементные подмножества, содержащие элемент $x_{n+1}$; во второй --- $(k+1)$-элементные подмножества, содержащие $x_n$ и не содержащие $x_{n+1}$; в третий --- $(k+1)$-элементные подмножества, содержащие $x_{n-1}$ и не содержащие $x_n$ и $x_{n+1}$ и т.д. В последний блок включим $(k+1)$-элементное подмножество, не содержащее элементов $x_{k+2},\ldots,x_n,x_{n+1}$, т.е. подмножество $\{x_1,x_2,\ldots,x_k,x_{k+1}\}$.

Число элементов в первом блоке равно $n \choose k$, во втором --- ${n-1} \choose k$, в третьем --- ${n-2} \choose k$, и так далее. В последнем блоке содержится ровно один элемент. Складывая эти коэффициенты, получаем тождество (\ref{eq:sum_high_index_bin_coeff}).

\begin{examp} Пусть $n=4$, $X=\{x_1,x_2,x_3,x_4,x_5\}$, $k=2$, $k+1=3$. Приведем список всех трехэлементных подмножеств этого множества:
$$
\{x_1,x_2,x_3\},\qquad \{x_1,x_2,x_4\},\qquad \{x_1,x_2,x_5\},\qquad \{x_1,x_3,x_4\},\qquad
\{x_1,x_3,x_5\},
$$
$$
\{x_1,x_4,x_5\},\qquad \{x_2,x_3,x_4\},\qquad \{x_2,x_3,x_5\},\qquad \{x_2,x_4,x_5\},\qquad
\{x_3,x_4,x_5\}.
$$
В первый блок разбиения этого множества подмножеств включим подмножества, содержащие элемент $x_5$; таковых имеется $\BCf{4}{2}=6$ штук. Из \emph{оставшегося} списка выберем все подмножества, содержащие $x_4$; их $\BCf{3}{2}=3$ штуки. Наконец, у нас остается единственное подмножество элементов, не содержащих ни $x_4$, ни $x_5$, т.е. подмножество $\{x_1,x_2,x_3,\}$.
\end{examp}



\myitem Название ``биномиальные коэффициенты'' связано с тем, что они, помимо всего прочего, встречаются в формуле бинома Ньютона
\begin{equation}
\label{eq:bin_Newton_simple}
(x+y)^n=\sum\limits_{k=0}^n{n\choose k}\,x^k\,y^{n-k}.
\end{equation}

\mysubitem Комбинаторное доказательство этой формулы довольно элементарно: нужно просто расписать $(x+y)^n$ в виде произведения $n$ сомножителей
$$
(x+y)^n=\underbrace{(x+y)}_1\cdot\underbrace{(x+y)}_2\cdot
\ldots\cdot\underbrace{(x+y)}_n
$$
и пометить каждый из таких сомножителей числом в диапазоне от единицы до $n$. В результате мы имеем множество $X$, состоящее из $n$ \emph{различных} экземпляров сомножителей вида $(x+y)$. 

После перемножения этих $n$ скобок получается определенный набор слагаемых вида $x^ky^{n-k}$, $k=0,1,\ldots,n$. Для подсчета количества этих слагаемых при фиксированном значении параметра $k$ заметим, что любое слагаемое $x^ky^{n-k}$ можно получить так: выбрать в $n$-элементном множестве $X$ $k$-элементное подмножество, взять в этом подмножестве в качестве сомножителей переменные $x$, а в оставшемся $(n-k)$-элементном подмножестве выбрать в качестве сомножителей переменные $y$. Как следствие, количество слагаемых $x^ky^{n-k}$ совпадает с количеством способов выбрать $k$-элементное подмножество $n$-элементного множества $X$ и равно $n\choose k$.

\mysubitem Формула (\ref{eq:bin_Newton_simple}) оказывается чрезвычайно полезной для вывода разного рода
соотношений, связанных с биномиальными коэффициентами. Например, полагая в ней $x=y=1$, получаем тождество
\begin{equation}
\label{eq:sum_bin_coeff_k}
\sum\limits_{k=0}^n{n\choose k}=2^n.
\end{equation}
Иными словами, мы формально доказали тот факт, что количество \emph{всех} подмножеств данного $n$-множества равно $2^n$. Комбинаторное доказательство этого факта будет дано в следующем параграфе.

\mysubitem Далее, полагая в (\ref{eq:bin_Newton_simple}) $x=-1$, $y=1$, получаем важное тождество
\begin{equation}
\label{eq:alt_sum_bin_coeff}
\sum\limits_{k=0}^n(-1)^k\,{n\choose k}=0,\qquad n>0.
\end{equation}
Заметим, что в случае $n=0$ эта сумма оказывается равной единице. 

\mysubitem Наконец, продифференцируем (\ref{eq:bin_Newton_simple}) по $x$:
\begin{equation}
\label{eq:bin_Newton_diff}
n\,(x+y)^{n-1}=\sum\limits_{k=1}^nk\,{n\choose k}\,x^{k-1}\,y^{n-k}.
\end{equation}
Подставляя в это равенство $x=y=1$, получим еще одно полезное равенство:
$$
\sum\limits_{k=1}^nk\,{n\choose k}=n\,2^{n-1}.
$$



\myitem Перейдем теперь к задачам, связанным с подсчетом $k$-сочетаний с повторениями.

\mysubitem Начнем с примера. Пусть множество $X$ состоит из двух чисел $1$ и $2$. Выпишем все $3$-сочетания с повторениями из $2$-множества $X$:
$$
\{1,1,1\},\qquad\{1,1,2\},\qquad\{1,2,2\},\qquad\{2,2,2\}.
$$
Как видно, таковых оказалось $4$ штуки. Как подсчитать это количество в общем случае?

\mysubitem Для решения данной задачи воспользуемся чрезвычайно полезным и часто использующимся в комбинаторике \emph{принципом биекции.} Формально этот принцип можно сформулировать следующим образом: пусть $X$, $Y$ --- пара конечных множеств, и пусть существует биекция $f\colon X\to Y$, т.е. такое отображение, что
$$
\forall \,y\in Y\qquad\qquad \exists ! \,x\in X:\qquad\qquad y=f(x).
$$
Тогда количество элементов в множествах $X$ и $Y$ совпадают: $|X|=|Y|=n$.

\mysubitem Неформально использование принципа биекции можно проиллюстрировать на следующем примере. Предположим, что вы устраиваете вечеринку и приглашаете на нее довольно много друзей. Как гостеприимный хозяин, вы встречаете всех своих друзей на входе в дом, но запоминаете только пришедших к вам девушек. В какой-то момент вы решаете подсчитать, сколько парней пришло к вам на вечеринку. Вы знаете количество пришедших к вам девушек, и вам кажется, что количество девушек и парней одинаково. Как вам быстро проверить это предположение? Ответ достаточно очевиден: попросить каждую девушку взять ровно одного парня за руку. Если в результате этой процедуры все множество гостей разбилось на пары, то ваше предположение окажется верным. Тем самым вы сильно упростили себе жизнь --- вам не пришлось проделывать довольно утомительную работу по пересчету пришедших к вам парней; вы просто воспользовались для их подсчета результатом уже проделанной работы по пересчету пришедших к вам девушек.

\mysubitem Вернемся теперь к задаче подсчета всех $k$-сочетаний с повторениями, т.е. всех $k$-муль\-ти\-мно\-жеств над $n$-множеством $X$. Для подсчета количества $\BCCf{n}{k}$ таких мультимножеств нам будет удобнее вначале конкретизировать $n$-множество $X$, а именно, взять в качестве $X$ множество $[n]:=\{1,2,\ldots,n\}$ первых $n$ натуральных чисел. Любое $k$-мультимножество такого множества можно записать, очевидно, в следующем виде:
$$
1\leq a_1\leq a_2\leq \ldots \leq a_k\leq n.
$$
Например, $3$-мультимножество $\{1,1,2\}$ над $2$-множеством $X=\{1,2\}$ можно записать так:
$$
1\leq (a_1=1)\leq (a_2=1)\leq (a_3=2)\leq (n=2).
$$
Теперь превратим в этой цепочке все нестрогие неравенства в строгие. Для этого мы к $a_2$ прибавим единицу, к $a_3$ --- двойку, к $a_4$ --- тройку, и так далее. К последнему числу $a_n$ мы, таким образом, добавим число $(k-1)$. В результате получим цепочку строгих равенств вида
$$
1\leq a_1< a_2+1<a_3+2<a_4+3< \ldots < a_k+(k-1)\leq n+(k-1).
$$
В нашем примере
$$
1\leq (a_1=1)< (a_2+1=2)< (a_3+2=4)\leq (n+(3-1)=4).
$$
Заметим, что в результате этой операции мы получили некоторое $k$-элементное подмножество \emph{различных} чисел вида $a_i+(i-1)$ множества $\tilde{X}=[n+k-1]$ всех чисел от единицы до $n+k-1$. Иными словами, мы сопоставили любому $k$-мультимножеству над множеством $X=[n]$ вполне определенное $k$-подмножество множества $\tilde{X}=[n+k-1]$. Очевидно, что это сопоставление взаимно-однозначно. Но количество всех $k$-подмножеств данного множества мы знаем --- оно равно $\BCf{n+k-1}{k}$. Следовательно, этому числу равно, по принципу биекции, и количество $\BCCf{n}{k}$ всех $k$-мультимножеств над множеством $X=[n]$:
$$
\BCCf{n}{k}=\BCf{n+k-1}{k}.
$$
Справедливость этого равенства для произвольного $n$-множества $X$ следует из принципа биекции.




\section*{Упражнения}

\begin{exerc} 
Доказать комбинаторно так называемую формулу суммирования по диагонали
\begin{equation}
\label{eq:sum_bin_coef_diag}
\sum\limits_{k=0}^n{{m+k}\choose k}={{m+n+1}\choose n}.
\end{equation}
\end{exerc}

\begin{exerc} 
Доказать комбинаторно тождество Вандермонта
$$
{{n+m}\choose k}=\sum\limits_{i=0}^k{n\choose i}\cdot{m\choose {k-i}}.
$$
\end{exerc}

\begin{exerc} 
Доказать комбинаторно следующее рекуррентное соотношение для количества $k$-сочетаний с повторениями:
\begin{equation}
\label{eq:comb_repet_recur}
\BCCf{n}{k}=\BCCf{n-1}{k}+\BCCf{n}{k-1},\qquad n,k=1,2,\ldots
\end{equation}
$$
\BCCf{n}{1}=\BCf{n}{1}=n;\qquad \BCCf{1}{k}=\BCf{k}{k}=1.
$$
\end{exerc}


\begin{exerc} 
Доказать комбинаторно следующее тождество:
$$
\BCCf{n+1}{k}=\sum\limits_{i=0}^k\BCCf{n}{k-i}.
$$
С его помощью доказать справедливость равенства
$$
\BCf{n+k}{n+1}=\sum\limits_{i=0}^k\BCf{n+k-i-1}{n}.
$$
\end{exerc}

\begin{exerc}
Используя формулу (\ref{eq:sum_high_index_bin_coeff}) суммирования по верхнему индексу, получить замкнутые выражения для сумм вида
$$
\sum\limits_{i=0}^k i,\qquad \sum\limits_{i=0}^k i^2,\qquad \sum\limits_{i=0}^k i^3.
$$
\end{exerc}


\begin{exerc} 
Доказать обобщенное правило суммы для произвольного количества $n$ множеств:
\begin{equation}
\label{eq:pr_sum_tot_n}
%\begin{aligned}
|A_1\cup A_2\cup\ldots\cup A_n|=\sum\limits_{i=1}^n |A_i|-\sum\limits_{1\leq i<j\leq n}|A_i\cap A_j|+
\sum\limits_{1\leq i<j<k\leq n}|A_i\cap A_j\cap A_k|-\ldots+(-1)^{n-1}|A_1\cup A_2\cup\ldots\cup A_n|.
%\end{aligned}
\end{equation}
\end{exerc}


\begin{exerc}
Вычислить значение выражения
$$
\sum\limits_{k=1}^nk\,{n\choose k}\,(-1)^k.
$$
\end{exerc}

\begin{exerc}
Сколько существует бинарных (т.е. состоящих из цифр $0$ и $1$) строк длины $n,$ содержащих $k$ единиц, в которых никакие две единицы не стоят рядом?
\end{exerc}

\begin{exerc}
Сколько существует шестизначных чисел, сумма цифр которых не превосходит $47$?
\end{exerc}

\begin{exerc}
Докажите, что $(1+x)^n+(1-x)^n \leq 2^n$ при $n \geq 1$ и$ |x| \leq 1$.
\end{exerc}




\section*{Решение упражнений}

\begin{sol_exerc}
Для доказательства этой формулы разобъем все множество $n$-элементных подмножеств $(n+m+1)$-элементного множества на блоки следующим образом. В первый блок включим подмножества, не содержащие элемент $x_1$. Количество таких подмножеств, очевидно, равно $\BCf{n+m}{n}$. Во второй блок включим подмножества, содержащие $x_1$, но не содержащие $x_2$. Таковых имеется $\BCf{n+m-1}{n-1}$ штук. В третий --- подмножества, содержащие $x_1$ и $x_2$, но не содержащие $x_3$, и так далее. Наконец, в последний, $(n+1)$-й блок, мы включим подмножество $\{x_1,x_2,\ldots,x_n\}$. Складывая количество элементов в каждом блоке, мы и получим формулу суммирования по диагонали (\ref{eq:sum_bin_coef_diag}). 

\end{sol_exerc}

\begin{sol_exerc}
Пусть у нас имеется группа, состоящая из $n$ мужчин и $m$ женщин. По определению, количество способов выбрать из нее команду, состоящую из $k$ человек, равно биномиальному коэффициенту $\BCf{n+m}{k}$. С другой стороны, мы можем выбирать эту команду так, чтобы в ней было ровно $i$ мужчин и $(k-i)$ женщин. При фиксированном $i$ количество способов подбора такой команды, согласно правилу произведения, равно $\BCf{n}{i}\cdot \BCf{m}{k-i}$. Меняя теперь $i$ от нуля до $k$, мы вновь получим общее количество способов образовать требуемую команду. 
\end{sol_exerc}

\begin{sol_exerc}
Как и при комбинаторном доказательстве рекуррентного соотношения для биномиальных коэффициентов, разобъем все $k$-мультимножества над множеством $X$ на два блока. В первый блок включим мультимножества, содержащие элемент $x_1\in X$, а во второй --- не содержащие $x_1$. Количество элементов в первом блоке равно, очевидно, $\BCCf{n}{k-1}$: нам из $n$-элементного множества $X$ осталось выбрать $(k-1)$ элемент. Мультимножества, принадлежащие второму блоку, содержат $k$ элементов, которые следует выбирать из $(n-1)$-элементного множества $X\setminus x_1$. Следовательно, их $\BCCf{n-1}{k}$ штук. 
\end{sol_exerc}

\begin{sol_exerc}
Разобъем все $k$-мультимножества над $(n+1)$-элементным множеством на блоки следующим образом. В первый блок включим все $k$-мультимножества, не содержащие элемент $x_1$, во второй --- $k$-мультимножества, содержащие ровно один элемент $x_1$, в третий --- содержащие ровно два элемента $x_1$, и так далее. В последний блок включим $k$-мультимножество, состоящее ровно из $k$ элементов $x_1$. Количество элементов в $(i+1)$-м блоке, $i=0,1,\ldots,k$,  равно $\BCCf{n}{k-i}$.  

Доказанную формулу можно переписать в виде 
$$
\BCf{n+k}{k}=\sum\limits_{i=0}^k\BCf{n+k-i-1}{k-i}.
$$
Учитывая, что $\BCf{n}{k}=\BCf{n}{n-k}$, последнее равенство можно переписать так:
$$
\BCf{n+k}{n}=\sum\limits_{i=0}^k\BCf{n+k-i-1}{n-1}.
$$
Заменяя теперь $n$ на $n+1$, а $k$ --- на $k-1$, получаем требуемый результат.
\end{sol_exerc}

\begin{sol_exerc}
Полагая в формуле (\ref{eq:sum_high_index_bin_coeff}) $k=1$, получаем хорошо известное выражение
$$
\sum\limits_{i=0}^n {i}=\BCf{n+1}{2}=\dfrac{n\,(n+1)}{2}
$$
для суммы арифметической прогрессии. 

Рассмотрим теперь формулу (\ref{eq:sum_high_index_bin_coeff}) при $k=2$:
$$
\sum\limits_{i=0}^n {\frac{i\cdot (i-1)}{2}}=\dfrac{1}{2}\sum\limits_{i=0}^n (i^2-i)=\BCf{n+1}{3}.
$$
С учетом формулы для суммы арифметической прогрессии получаем, что
$$
\qquad \sum\limits_{i=1}^n {{i^2}}=2\cdot \BCf{n+1}{3} + \BCf{n+1}{2} = \frac{n^3}{3}+\frac{n^2}{2}+\frac{n}{6}.
$$

Наконец, положим в формуле (\ref{eq:sum_high_index_bin_coeff}) $k=3$:
$$
\sum\limits_{i=0}^n {\frac{i\cdot (i-1) \cdot (i-2)}{6}}=\dfrac{1}{6}\sum\limits_{i=0}^n (i^3-3i^2+2i)
=\dfrac{1}{6}\sum\limits_{i=0}^n (i^3-3i(i-1)-i)
=\BCf{n+1}{4}.
$$
Отсюда с учетом уже найденных выше формул имеем
$$
\sum\limits_{i=1}^n {{i^3}}=6\cdot \BCf{n+1}{4} + 6\cdot \BCf{n+1}{3} + \BCf{n+1}{2}=\frac{n^4}{4}+\frac{n^3}{2}+\frac{n^2}{4}.
$$
\end{sol_exerc}

\begin{sol_exerc}
Необходимо доказать, что любой элемент множества $X=A_1\cup A_2\cup\ldots\cup A_n$ встречается  в правой части (\ref{eq:pr_sum_tot_n}) ровно один раз. Пусть элемент $x$ принадлежит в точности $k$ множествам из совокупности рассматриваемых $n$ множеств. Тогда в сумме $\sum_i|A_i|$ этот элемент учтен ровно $k$ раз. 

Рассмотрим теперь сумму
$$
\sum\limits_{i<j}|A_i\cap A_j|.
$$
В эту сумму элемент $x$ входит всякий раз, когда выбираются два элемента из множества $\Sigma_x$, $|\Sigma_x|=k$, множеств, содержащих элемент $x$. Количество способов выбрать двухэлементные подмножества множества $\Sigma_x$ равно биномиальному коэффициенту $\BCf{k}{2}$. 

Аналогично, рассматривая сумму
$$
\sum\limits_{i<j<l}|A_i\cap A_j\cap A_l|,
$$
мы получаем  $\BCf{k}{3}$ способов выбора трех подмножеств множества $\Sigma_x$, каждое из которых содержит $x$. 

Продолжая данные рассуждения, мы видим, что количество вхождений элемента $x$ в правую часть (\ref{eq:pr_sum_tot_n}) рассчитывается по формуле
$$
k- \BCf{k}{2}+\BCf{k}{3}-\ldots+(-1)^{n-1}\BCf{k}{k}.
$$
Согласно соотношению (\ref{eq:alt_sum_bin_coeff}), данная сумма равна единице. Следовательно, элемент $x$ в правой части (\ref{eq:pr_sum_tot_n}) подсчитывается ровно один раз. 
\end{sol_exerc}


\begin{sol_exerc}
Подставим в равенство (\ref{eq:bin_Newton_diff}), полученное дифференцированием (\ref{eq:bin_Newton_simple}) по $x$, значения $x=-1$, $y=1$: 
$$
\sum\limits_{k=1}^nk\,{n\choose k}\,(-1)^{k-1}=n \cdot 0^{n-1}.
$$
Отсюда следует, что
$$
\sum\limits_{k=1}^nk\,{n\choose k}\,(-1)^k = 0 \quad \text{при} \quad n \neq 1.
$$
При $n=1$ соответствующая сумма равна минус единице.
\end{sol_exerc}

\begin{sol_exerc}
Рассмотрим строку, состоящую из $(n-k)$ нулей. Поставив на любую из $(n-k-1)$ позиций между нулями, а также на любую из двух границ строки, единицу, получим строку, описанную в условии задачи. Поэтому ответом для данной задачи является  значение $\binom{n-k+1}{k}$.
\end{sol_exerc}


\begin{sol_exerc}
Для решения данной задачи вновь удобно воспользоваться принципом ``плохой-хороший'' (\ref{eq:good_bad}), заметив, что достаточно просто сосчитать количество шестизначных чисел, сумма цифр в которых больше или равна $48$. Действительно, простейшее шестизначное число, сумма цифр в котором равна $48$, есть число $888888$. Оно получается из числа $999999$ вычитанием из каждого разряда по единице. Теперь несложно понять, что и любое другое число, сумма цифр в котором равна $48$, получается вычитанием шести единиц из любых разрядов числа $999999$. Любое же число, сумма цифр в котором больше $48$, получается вычитанием пяти или менее единиц из любых разрядов числа $999999$. Количество способов вычесть $i$ единиц из числа $999999$ равно, очевидно, $\BCCf{6}{i}$. Общее количество шестизначных чисел равно $9\cdot 10^5.$ Следовательно, количество чисел, сумма цифр в котором строго меньше $48$, равно
$$
9 \cdot 10^5 - \sum_{i=0}^6 \BCCf{6}{i}= 9 \cdot 10^5 - \sum_{i=0}^6 \BCf{5+i}{i} = 9 \cdot 10^5 - \BCf{12}{6}.
$$
Последнее равенство получено с использованием формулы (\ref{eq:sum_bin_coef_diag}) суммирования по диагонали.
\end{sol_exerc}


\begin{sol_exerc}
Разложим левую часть с помощью формулы бинома Ньютона:
$$
(1+x)^n+(1-x)^n=\sum\limits_{k=0}^n{n\choose k}\,x^k+\sum\limits_{k=0}^n (-1)^k{n\choose k}\,x^k=
$$
$$
=2\cdot \sum\limits_{k=0,2,4,\dots}^n{n\choose k}\,x^k \leq 2\cdot \sum\limits_{k=0,2,4,\dots}^n{n\choose k}.
$$
Так как сумма  биномиальных коэффициентов по чётным $k$ равна сумме по нечётным (равенство (\ref{eq:alt_sum_bin_coeff})), а вместе эти суммы равны $2^n$ (равенство (\ref{eq:sum_bin_coeff_k})), то каждая из этих сумм равна $2^{n-1}$. Отсюда следует, что последнее записанное выражение равно в точности $2^n$. Неравенство доказано.
\end{sol_exerc}









\section{$k$-перестановки из $n$ элементов. Урновые схемы и схемы раскладки предметов по ящикам.}

\myitem Перейдем теперь к подсчету количества $k$-перестановок из $n$ элементов, т.е. к подсчету различных \emph{упорядоченных} наборов $(a_1,a_2,\ldots,a_k)$, в которых все $a_i$ принадлежат одному и тому же $n$-элементному множеству $X$.

\mysubitem Заметим, прежде всего, что в различной литературе встречается довольно много альтернативных названий для данного объекта. Именно, упорядоченный набор $(a_1,a_2,\ldots,a_k)$, $a_i\in X$, также иногда называется
\begin{itemize}
\item[--] $k$-размещением из $n$ элементов;
\item[--] кортежем из $k$ элементов множества $X$;
\item[--] упорядоченной $k$-выборкой из $n$ элементов;
\item[--] $k$-мерным вектором над множеством $X$;
\item[--] $k$-элементным словом над $n$-элементным алфавитом.
\end{itemize}

Элементы $a_i$ в наборе $(a_1,a_2,\ldots,a_k)$ могут как повторяться, так и не повторяться. В первом случае говорят о $k$-перестановках с повторениями, во втором --- о $k$-перестановках без повторений.

Номер паспорта --- это типичный пример $k$-перестановки с повторениями над множеством из десяти цифр $X=\{0,1,\ldots,9\}$. Классическим примером $3$-перестановки без повторений является упорядоченный список спортсменов, занявших призовые места в любых спортивных соревнованиях.

\mysubitem Сосчитаем вначале количество $k$-перестановок с повторениями. 

\begin{propos} \label{propos:num_k_permut}
Количество $k$-перестановок с повторениями из $n$ элементов равно $n^k$.
\end{propos}

Для доказательства можно либо просто сослаться на правило произведения, либо рассмотреть $(a_1,a_2,\ldots,a_k)$, $a_i\in X$ как слово из $k$ элементов над алфавитом из $n=|X|$ букв. На первое место в слове мы можем поставить любую из $n$ букв, на второе --- также любую из $n$ букв и так далее. Всего же получаем $n^k$ вариантов записать данное слово.

\mysubitem В качестве важного приложения доказанного выше результата сосчитаем еще раз, на этот раз комбинаторно, количество подмножеств данного множества $X$. Для этого воспользуемся принципом биекции. Именно, закодируем любое подмножество $A$ множества $X$ бинарной строкой $f(A)$ длины $n$, то есть строкой над алфавитом $\{0,1\}$. Единицу на $i$-м месте поставим в случае, если элемент $x_i\in A$. В противном случае на $i$-е место поставим ноль.

Например, пусть $X=\{x_1,x_2,x_3,x_4\}$, $A=\{x_2,x_4\}$. Тогда соответствующая подмножеству $A$ строка длины $4$ записывается следующим образом:
$$
f(A)=(0,1,0,1).
$$

Очевидно, что построенное отображение $f$ взаимно-однозначно. Следовательно, количество подмножеств данного $n$-множества $X$ совпадает с количеством бинарных строк длины $n$, которое, согласно доказанному выше yтверждению \ref{propos:num_k_permut}, равно $2^n$.

\mysubitem Перейдем теперь к подсчету количества перестановок без повторений. 

\begin{propos} Количество $P(n,k)$ $k$-перестановок из $n$ элементов без повторений равно
$$
P(n,k)=n\cdot (n-1)\cdot\ldots\cdot (n-k+1)=:(n)_k.
$$
\end{propos}

\evids очевидно --- на первое место в строке длины $k$ я могу поставить любой из $n$ элементов, на второе --- любой из оставшихся $(n-1)$ элементов и так далее.


\mysubitem В частном случае $k=n$ $k$-перестановки из $n$ элементов без повторений называются просто
перестановками $n$-элементного множества $X$. Их количество равно
$$
P_n\equiv P(n)=n!,\qquad P(0)=0!=1.
$$

\mysubitem Любую $k$-перестановку из $n$ элементов без повторений можно рассматривать и как упорядоченное $k$-подмножество $n$-множества. Мы знаем, что количество всех $k$-подмножеств $n$-множества равно $\BCf{n}{k}$, а количество способов упорядочить $k$-подмножество равно количеству перестановок этих $k$ элементов, т.е. $k!$. Следовательно, числа $(n)_k$ и $\BCf{n}{k}$ связаны соотношением
$$
(n)_k=k!\cdot \BCf{n}{k}\qquad \Longrightarrow \qquad \BCf{n}{k}=\dfrac{(n)_k}{k!}.
$$
Последняя формула часто используется как некомбинаторное определение биномиальных коэффициентов
$\BCf{n}{k}$ в случае, когда $k\in\Z$, а $n$ принадлежит $\Z$, $\R$ или даже $\C$. Именно, по определению,
$$
\BCf{q}{k}:=\begin{cases}
\dfrac{q\,(q-1)\,\ldots\,(q-k+1)}{k!}=:\dfrac{(q)_k}{k!},& \text{если $k\in\N$,}\\
1,&\text{если $k=0$,}\vphantom{\dfrac{q}{k}}\\
0,&\text{если $k<0$,}
\end{cases}\qquad \forall\,\,q\in\C.
$$
Например,
$$
\BCf{-1}{3}=\dfrac{(-1)\cdot(-2)\cdot(-3)}{3\cdot 2\cdot 1}=-1.
$$

\mysubitem Функцию $(q)_k$ часто также обозначают через $q^{\underline{k}}$ и называют \emph{убывающей факториальной степенью} \cite{Grah_Knut_Pat}. Наряду с убывающей можно ввести и так называемую \emph{возрастающую факториальную степень} 
$$
q^{(k)}\equiv q^{\overline{k}}:=q\cdot(q+1)\cdot\ldots\cdot (q+k-1).
$$
В частности, с ее помощью получается удобное для вычислений выражение для количества $\BCCf{n}{k}$ сочетаний с повторениями:
$$
\BCCf{n}{k}=\BCf{n+k-1}{k}=\dfrac{n^{(k)}}{k!}.
$$



\myitem Итак, мы получили простые соотношения для подсчета количества четырех основных объектов элементарной комбинаторики --- $k$-сочетаний и $k$-перестановок из $n$ элементов с повторениями и без повторений. Эти объекты встречаются в огромном количестве внешне не очень похожих друг на друга задач элементарной комбинаторики. Оказывается, однако, что большинство этих задач можно свести к одной из двух простейших схем --- либо к так называемой урновой схеме, либо к схеме раскладки предметов по ящикам.

\mysubitem В урновой схеме имеется урна, в которой находятся $n$ \emph{различимых} предметов. Из урны последовательно вытаскивается $k$ предметов. Задача состоит в подсчете количества различных способов выбора этих предметов, или, как еще говорят, в подсчете различных $k$-элементных выборок из $n$ предметов, находящихся в урне.

На практике наиболее часто встречаются четыре модификации этой задачи, различающиеся способами
формирования $k$-элементной выборки. Прежде всего, мы можем возвращать или не возвращать вытаскиваемые
предметы обратно в урну. В первом случае говорят о \emph{выборке с повторениями}, во втором --- о
 \emph{выборке без повторений.} Далее, в некоторых задачах нам важен порядок вытаскиваемых предметов. В этом случае имеем так называемые \emph{упорядоченные} выборки. В противном случае выборки называются 
\emph{неупорядоченными}.

Нетрудно понять, что задачи о подсчете $k$-элементных выборок представляют собой, по сути, те же самые задачи о подсчете $k$-перестановок или $k$-сочетаний из $n$ элементов. Действительно, любая неупорядоченная $k$-элементная выборка представляет собой либо $k$-элементное подмножество $n$-множества, либо $k$-мультимножество над $n$-элементным множеством в зависимости от того, возвращаем мы вытаскиваемые предметы обратно в урну или не возвращаем. Следовательно, количество таких неупорядоченных выборок совпадает с коэффициентами $\BCf{n}{k}$ или $\BCCf{n}{k}$. Очевидно также, что любая упорядоченная $k$-элементная выборка есть просто некоторая $k$-перестановка $n$-элементного множества. Поэтому количество таких выборок равно $n^k$ или $(n)_k$ в зависимости от того, говорим ли мы о выборке с повторениями или без повторений. 

В результате получаем следующую таблицу решений задач, связанных с урновыми схемами:

\begin{center}
\begin{tabular}{|c|c|c|}
\hline
\phantom{$\dfrac{C}{C}$}Предметы на выходе & с возвращением & без возвращения \\
\hline
\phantom{$\dfrac{C}{C}$}упорядоченные & $n^k$ & $(n)_k$      \\
\hline
\phantom{$\dfrac{C}{C}$}неупорядоченные    &  $\BCCf{n}{k}$ & $\BCf{n}{k}$ \\
\hline
\end{tabular}
\end{center}

\mysubitem Приведем несколько характерных примеров, достаточно естественно сводящихся к одной из описанных выше урновых схем.

\begin{examp} Предположим, что у нас имеется некоторое общество, состоящее из двадцати членов. Сколькими способами можно выбрать президента, вице-президента, секретаря и казначея этого общества?
\end{examp}

\decis Очевидно, что любой способ выбора представляет собой упорядоченное $4$-элементное подмножество $20$-элементного множества. Следовательно, существует ровно $(20)_4$ различных способов выбора членов общества на эти должности.

\begin{examp}
Для того, чтобы открыть сейф, нужно набрать код из пяти символов с помощью вращающихся дисков. На каждом из этих дисков нанесено $12$ символов, одинаковых для каждого из дисков. Сколько вариантов различных кодов существует? 
\end{examp}

\decis Любой код представляет собой упорядоченную $5$-элементную выборку с повторениями или, иначе, строку из пяти символов над алфавитом из $12$ букв. Следовательно, имеется $12^5$ вариантов различных кодов. 

\begin{examp}
На почте продаются открытки десяти различных видов. Сколькими способами можно купить восемь открыток? А восемь открыток разных видов?
\end{examp}

\decis Понятно, что в первом случае любой набор из восьми открыток представляет собой неупорядоченную выборку с повторениями, а во втором --- выборку без повторений из $10$ элементов. Следовательно, в первом случае имеем $\BCCf{10}{8}$, а во втором --- $\BCf{10}{8}$ способов покупки восьми открыток. 



\mysubitem Второй, не менее популярной в элементарной комбинаторике схемой, связанной с подсчетом количества $k$-перестановок и $k$-сочетаний, является схема раскладки предметов по ящикам. В этой схеме имеется $n$ \emph{различимых} ящиков, по которым нужно разложить $k$ \emph{различимых} или \emph{неразличимых} предметов. При этом мы можем накладывать определенные ограничения на количество предметов в каждом ящике. 

Рассмотрим, к примеру, задачу о подсчете количества способов раскладки $k$ различимых предметов по $n$ различимым ящикам при условии, что в любой ящик можно класть любое количество предметов. Количество способов совершить эти действия равно, очевидно, $n^k$. Действительно, любой предмет мы можем положить в любой из $n$ ящиков вне зависимости от того, куда мы положили оставшиеся предметы. Поэтому, согласно правилу произведения, это количество равно $n^k$. Иными словами, данная задача представляет собой переформулировку задачи о подсчете количества $k$-перестановок из $n$ элементов с повторениями. 

Теперь предположим, что в той же схеме мы не имеем права класть более одного предмета в один ящик. Тогда первый предмет мы можем поместить в любой из $n$ ящиков, второй --- в любой из оставшихся свободными $(n-1)$ ящиков и так далее. Всего же получаем $(n)_k$ способов раскладки. Следовательно, данная схема соответствует подсчету $k$-перестановок без повторений. 

\mysubitem Пусть теперь у нас имеются $n$ различимых ящиков и $k$ неразличимых предметов. Тогда подсчет количества различных способов раскладки этих предметов по ящикам сводится к задаче о подсчете количества $k$-сочетаний из $n$ элементов. 

Действительно, в данной схеме в качестве $n$-элементного множества выступает множество, состоящее из $n$ различимых ящиков. В случае, когда в каждый ящик можно класть не более одного предмета, мы, раскладывая предметы по ящикам, выделяем в этом множестве некоторое $k$-элементное подмножество. Следовательно, количество таких раскладок совпадает с количеством различных $k$-элементных подмножеств $n$-множества и равно $\BCf{n}{k}$.

В случае же, когда никаких ограничений на количество предметов в ящике не накладывается, мы, раскладывая по ящикам $k$ неразличимых предметов, задаем тем самым некоторое $k$-мультимножество $n$-множества $X$. Поэтому количество различных способов такой раскладки равно количеству $\BCCf{n}{k}$ $k$-сочетаний из $n$ элементов с повторениями.

Подводя итоги, построим таблицу рассмотренных схем раскладок $n$ предметов по $k$ ящикам:

$$
\begin{array}{|c|c|c|c|c|}
\hline
          &
& \mbox{Произвольное}&
\mbox{Не более}  \\
\mbox{Предметы}          &\mbox{Ящики}
& \mbox{количество предметов}&
\mbox{одного предмета}  \\
      & 
& \mbox{в ящике}&
\mbox{в ящике}  \\[2pt]
\hline
\vphantom{\Biggl(\Biggr)}\mbox{различимые} &  \mbox{различимые}
 & n^k & (n)_k  \\[2pt]
\hline
\vphantom{\Biggl(\Biggr)}\mbox{неразличимые} &  \mbox{различимые}  &
\vphantom{\Biggl(\Biggr)}\BCCf{n}{k}  &
\vphantom{\Biggl(\Biggr)}\BCf{n}{k}   \\[2pt]
\hline
\end{array}
$$

\mysubitem Проиллюстрируем некоторые характерные примеры задач, которые довольно естественно сводятся к схеме  схем раскладки предметов по ящикам. 

\begin{examp} 
Сколькими способами можно разложить по двум \emph{различимым} карманам (например, левому и правому) девять монет \emph{различного} достоинства?
\end{examp}

\decis Рассматриваемый пример является типичной задачей, которая естественным образом сводится к схеме раскладки предметов по ящикам. Действительно, в роли ящиков здесь выступают левый и правый карман, а в роли предметов --- девять различных монет. Поэтому ответ в этой задаче --- $2^9$ способов. 

\begin{rem} Рассмотренная задача, однако, не всегда решается верно: в качестве ответа иногда выдают $9^2$ способов. Путаница, как правило, происходит потому, что эту задачу пытаются свести к урновой схеме, считая, что имеются урна, в которой расположены $9$ различных предметов, а также $2$ различимые позиции на выходе.

Для того, чтобы этой путаницы избежать, полезно сформулировать следующие основные отличия схемы
раскладки по ящикам от соответствующей ей урновой схемы. Во-первых, в схеме раскладки предметов по ящикам
предметы обратно не возвращаются, они остаются в ящике. Во-вторых, в этой схеме в любой ящик можно класть любое количество предметов. В аналогичной урновой схеме на любую позицию помещается ровно один предмет.
\end{rem}

Приведем теперь два характерных примера, связанных с раскладкой неразличимых предметов по различимым ящикам. 

\begin{examp} У отца имеется $5$ (неразличимых) апельсинов, которые он может раздать восьми своим сыновьям. Если его задача состоит в том, чтобы раздать их максимальному количеству сыновей, то он должен поставить дополнительное условие --- любой из его сыновей не должен получить более одного апельсина. В этом случае количество способов, которыми он может раздать своим сыновьям эти пять апельсинов, равно, очевидно, $\BCf{8}{5}$. Если же он раздает их по каким-то заслугам, и может, таким образом, любому сыну отдать любое количество апельсинов, то количество способов это сделать равно $\BCCf{8}{5}=\BCf{12}{5}$.
\end{examp}

\begin{examp} В физике встречаются задачи, в которых имеются $n$ различных уровней энергии и $k$ неразличимых элементарных частиц. Если эти частицы --- фермионы, то для них действует так называемый принцип запрета Паули, согласно которому на любом энергетическом уровне может находиться не более одной элементарной частицы. Как следствие, количество различных распределений $k$ фермионов по $n$ энергетическим уровням равно $\BCf{n}{k}$. Наряду с фермионами существуют и частицы иного сорта --- бозоны, для которых не существует ограничений на количество частиц, занимающих один и тот же уровень энергии. Для бозонов количество таких распределений равно, очевидно, $\BCCf{n}{k}$.
\end{examp}


\mysubitem К задачам раскладки неразличимых предметов по различимым ящикам, связанным с подсчетом количества $k$-сочетаний, сводятся также задачи о так называемом \emph{разбиении} натурального числа $k$ на $n$ слагаемых. Данная задача формулируется следующим образом: сколькими способами можно представить натуральное число $k$ в виде суммы $n$ слагаемых вида
$$
a_1+a_2+\ldots+a_n=k
$$
при условии, что порядок слагаемых важен, то есть при условии, что разбиения вида
$$
1+3+3+3=10\qquad \qquad \mbox{и} \qquad \qquad 3+1+3+3=10
$$
считаются различными?

Если на числа $a_i$ накладывается единственное условие вида $a_i\geq 0$, то количество разбиений равно количеству $\BCCf{n}{k}$ $k$-мультимножеств над $n$-элементным множеством. Действительно, в упорядоченной сумме $a_1+a_2+\ldots+a_n$ любой индекс $i$ слагаемого $a_i$ можно рассматривать как $i$-й ящик, в который мы складываем $a_i$ единиц. Следовательно, эту задачу можно трактовать как задачу о раскладке $k$ ``неразличимых'' единиц по $n$ различимым ящикам.

\begin{examp} Подсчитать количество разбиений числа $k=4$ на два слагаемых:
$$
a_1+a_2=4,\qquad a_1,a_2\geq 0.
$$
\end{examp}

\answer $\BCCf{2}{4}=\BCf{5}{4}=5$ разбиений: $0+4=1+3=2+2=3+1=4+0=4.$

К подсчету числа $k$-сочетаний из $n$ элементов без повторений задача о разбиении числа $k$ сводится в случае, когда на числа $a_i$ накладываются следующие условия:
$$
a_i=0\qquad \mbox{или} \qquad a_i=1.
$$
В этом случае индекс $i$ также можно трактовать как $i$-й ящик; его можно выбрать (положив $a_i=1$) или не выбрать (положив $a_i=0$). Всего же нужно выбрать $k$ таких ящиков. Это можно сделать $\BCf{n}{k}$ способами.

\begin{examp} Подсчитать количество разбиений числа $2$ на три слагаемых при условии, что любое слагаемое может принимать значения $0$ или $1$. 
\end{examp}

\answer $\BCf{3}{2}=3$ разбиения: $1+1+0=1+0+1=0+1+1=2.$

\mysubitem Достаточно часто на практике встречаются ситуации, когда одну и ту же задачу можно свести и к урновой схеме, и к схеме раскладки предметов по ящикам.

\begin{examp} В кондитерском магазине продаются пирожные трех разных видов. Сколькими различными способами можно купить семь пирожных? 
\end{examp}

\decis Ответ в этой задаче, очевидно, равен $\BCCf{3}{7}=\BCf{9}{7}$. Этот ответ можно, например, получить, представляя себе коробку с тремя отделениями, в каждое из которых кладется пирожное только одного вида; в этом случае мы сводим задачу к подсчету количества раскладок семи неразличимых предметов по трем различимым ящикам. Другой способ получить тот же ответ --- это представлять себе урну, в которой находятся три разных пирожных, и считать количество способов выбора из урны семи пирожных с возвращениями любого выбранного пирожного обратно в урну. Наконец, можно вообще забыть о любых схемах, если понимать, что любые семь купленных пирожных трех различных видов представляют собой $7$-мультимножество над $3$-элементным множеством различных видов пирожных.




\section*{Упражнения}

\begin{exerc} 
Дать комбинаторное доказательство следующих рекуррентных соотношений для чисел $P(n,k)$:
$$
P(n,k)=P(n-1,k)+k\,P(n-1,k-1),\qquad n\geq 1, \quad k=1,\ldots,n;
$$
$$
P(n,0)=1,\quad n=0,1,2,\ldots;\qquad P(n,k)=0,\quad k>n.
$$
\end{exerc}

\begin{exerc} 
На перекрестке имеется 6 светофоров. Сколько существует различных состояний этих светофоров, если каждый из них независимо от других имеет три возможных состояния --- горит красный, горит желтый или горит зеленый?
\end{exerc}

\begin{exerc} 
В купе поезда едет 6 человек. Поезд делает 5 остановок. Сколькими способами пассажиры могут распределиться между этими остановками?
\end{exerc}

\begin{exerc} 
Сосчитать количество способов раскладки $k$ неразличимых предметов по $n$ различимым ящикам при условии, что в каждом ящике должен находиться как минимум один предмет.
\end{exerc}

\begin{exerc} 
Подсчитать количество разбиений числа $k$ при ограничениях
$$
a_i\geq s_i,\quad i=1,\ldots,n;\qquad \qquad s_1+s_2+\ldots+s_n=:s\leq k.
$$
\end{exerc}


\begin{exerc} 
Сколько существует девятизначных чисел, записанных в $n$-ичной системе счисления, у которых все девять цифр различны?
\end{exerc}

\begin{exerc} 
Трое мужчин и две женщины выбирают себе место работы. В городе имеются три фирмы, в которых требуются только мужчины, две --- в которых требуются только женщины, и две --- в которых берут и мужчин, и женщин. Сколькими способами они могут выбрать себе место работы?
\end{exerc}

\begin{exerc} 
Восемь студентов выбирают себе спецкурсы на семестр из списка, состоящего из четырех спецкурсов. Сколькими способами студенты могут записаться на эти спецкурсы так, чтобы каждый студент записался хотя бы на один спецкурс?
\end{exerc}

\begin{exerc} 
Сколько существует булевых функций $n$ аргументов?
\end{exerc}

\begin{exerc} 
Сколько чисел, меньших миллиона, можно записать с помощью цифр $8$ и $9?$
\end{exerc}



\section*{Решение упражнений}

\begin{sol_exerc}
Разобъем все множество $k$-перестановок без повторений на два блока. В первый блок поместим все перестановки, не содержащие элемента $x_n$, а во второй --- перестановки, содержащие данный элемент. Количество перестановок в первом блоке равно, очевидно, $P(n-1,k)$. Для подсчета количества элементов во втором блоке заметим, что у элемента $x_n$ существует $k$ способов занять свое место в перестановке. При любом фиксированном положении этого элемента существует $P(n-1,k-1)$ способов расставить оставшиеся элементы по $(k-1)$-й позиции. 

Начальные условия очевидны: выбрать и упорядочить $0$ предметов всегда можно лишь одним способом, а количество способов выбрать $k$ предметов из множества мощности $n<k$ равно нулю. 
\end{sol_exerc}

\begin{sol_exerc}
Любое состояние шести светофоров можно рассматривать как слово, состоящее из шести букв, над алфавитом, состоящим из трех цветов. Как следствие, имеем $3^6$ вариантов различных состояний.
\end{sol_exerc}

\begin{sol_exerc}
Данная задача допускает, вообще говоря, две различные постановки. В первой постановке задачи мы различаем пассажиров. В таком случае задачу можно свести к раскладке шести различимых предметов по пяти различимым ящикам без ограничений на количество предметов в каждом ящике. Как следствие, имеется $5^6$ различных вариантов. 

Во второй постановке задачи мы пассажиров не различаем, и имеем, таким образом, задачу о раскладке шести неразличимых предметов по пяти различимым ящикам при условии отсутствия ограничений на количество предметов в каждом ящике. При таких условиях имеется $\BCCf{5}{6}$ способов распределения пассажиров по этим остановкам.
\end{sol_exerc}

\begin{sol_exerc}
Легче всего свести данную задачу к известной задаче о раскладке неразличимых предметов по различимым ящикам без каких-либо ограничений на количество предметов в каждом ящике. Для этого положим в каждый из ящиков по одному предмету. Количество способов раскладки оставшихся $(k-n)$ предметов по $n$ ящикам равно $\BCCf{n}{k-n}$. 
\end{sol_exerc}


\begin{sol_exerc}
Как и предыдущую задачу, данную задачу также легко свести к задаче о раскладке неразличимых предметов по различимым ящикам без ограничений на количество предметов в ящике. Для этого нужно поместить в $i$-й ящик $s_i$ предметов. Останется разложить ещё $(k-s)$ предметов по тем же $n$ ящикам, причём уже без всяких ограничений. Количество способов это сделать равно $\BCCf{n}{k-s}$.  
\end{sol_exerc}


\begin{sol_exerc}
Первую цифру можно выбрать $(n-1)$-м способом, а размещение цифр по оставшимся восьми разрядам можно рассматривать как упорядоченную выборку восьми предметов (цифр) из $(n-1)$. 

\answer $(n-1)\cdot (n-1)_8$.
\end{sol_exerc}

\begin{sol_exerc}
Каждый из трёх мужчин выбирает одну фирму из пяти, и каждый возможный способ выбора кодируется строкой из трёх букв над алфавитом из пяти символов. Аналогично, выбор женщин кодируется строкой из двух символов над алфавитом из четырёх символов. По правилу произведения, общее число способов равно $5^3\cdot 4^2$.
\end{sol_exerc}

\begin{sol_exerc}
Закодируем выбор некоторого студента битовой строкой из четырёх символов. В этой строке $i$-й символ будет равен единице, если студент выбрал $i$-й спецкурс, и нулю, если не выбрал. Всего таких битовых строк $2^4=16$, но одна, состоящая из всех нулей, нам не подходит. Остаётся $15$ вариантов для каждого студента. Студенты делают независимый выбор, а значит, по правилу произведения, общее число способов выбрать курсы равно $15^8$. 
\end{sol_exerc}

\begin{sol_exerc}
Число различных наборов из $n$ аргументов равно $2^n$. Задать всевозможные булевы функции можно, выбрав в качестве значения функции один из двух вариантов на каждом таком наборе. Количество способов сделать такой выбор равно $2^{2^n}$.
\end{sol_exerc}

\begin{sol_exerc}
Любое описанное в условии задачи число может иметь в длину от одного до шести разрядов. Если число разрядов равно $i$, то выбрать значения этих разрядов можно $2^i$ способами (значение каждого разряда выбирается двумя способами). Поэтому общее количество описанных выше чисел есть
$$
\sum_{i=1}^6 2^i = 2^7-2=126.
$$
\end{sol_exerc}





\section{Подсчет количества отображений конечных множеств. Числа Стирлинга второго рода}

\myitem Оказывается, задачи о раскладке различимых предметов по различимым же ящикам имеют и еще одну,
чрезвычайно важную комбинаторную интерпретацию --- они эквивалентны задачам о подсчете количества
отображений конечных множеств.

\mysubitem Напомним определение произвольного отображения $f\colon X\to Y$. 

\begin{defin} Пусть $X$, $Y$ --- пара конечных множеств. Отображением $f$ из $X$ в $Y$ называется правило, согласно которому любому элементу $x\in X$ ставится в соответствие единственный элемент $y\in Y$:
$$
\forall\,x\in X \qquad \exists! \,y\in Y\colon\qquad y=f(x).
$$
\end{defin}

С комбинаторной точки зрения любое отображение $f$ из $n$-элементного множества $X$ в $k$-элементное множество $Y$ можно рассматривать как некоторый вариант раскладки $n$ различимых предметов по $k$ различимым ящиками при отсутствии каких-либо ограничений на количество предметов в каждом ящике.

\begin{figure}[h]
\centering
  \includegraphics[scale=0.5]{pics/function.eps}
\caption{}
\label{fig:examp_funct}
\end{figure}


\begin{examp}  \label{examp:any_f}
Рассмотрим отображение $f$ из трехэлементного множества $X$ в четырехэлементное множество $Y$ вида
$$
f(x_1)=y_2,\qquad f(x_2)=y_2,\qquad f(x_3)=y_4
$$
(смотри рис.\ref{fig:examp_funct}). Этому отображению отвечает раскладка трех различимых предметов по четырем различимым ящикам, при которой первые два предмета размещаются во втором ящике, а третий предмет --- в четвертом ящике.
\end{examp}

Как следствие, общее количество всех отображений $n$-элементного множества $X$ в $k$-элементное множество $Y$ равно $k^n$.

\mysubitem Напомним теперь определение \emph{инъективного} отображения.

\begin{defin} Отображение $f\colon X\to Y$ называется инъективным, если из условия
$$
f(x_1)=f(x_2)\qquad \Longrightarrow\qquad x_1=x_2.
$$
Иными словами, отображение называется инъективным, если у любого образа (элемента $y\in Y$) имеется не более одного прообраза, т.е. элемента $x\in X$, такого, что $y=f(x)$.
\end{defin}

Понятно, что любому инъективному отображению $f\colon X\to Y$ отвечает такая раскладка $n$ элементов множества $X$, при которой в каждом из $k$ ящиков находится не более одного элемента. Как следствие, количество  всевозможных инъективных отображений равно $(k)_n$.

\mysubitem Наконец, рассмотрим случай биективного и сюръективного отображений. 

\begin{defin} Отображение $f\colon X\to Y$ называется \emph{биективным,} если
$$
\forall \, y\in Y\qquad \exists! \,x\in X\colon\qquad y=f(x).
$$
\end{defin}

Количество таких отображений равно, очевидно, $n!$, где $n=|X|=|Y|$.


\begin{defin} Отображение $f\colon X\to Y$ называется сюръективным, если
$$
\forall \, y\in Y\qquad \exists \,x\in X\colon\qquad y=f(x).
$$
Другими словами, отображение сюръективно, если каждый образ $y\in Y$ имеет хотя бы один прообраз $x\in X$.
\end{defin}

Комбинаторная интерпретация сюръективного отображения такова: это есть некоторая раскладка $n$ различимых предметов по $k$ различимым ящикам при условии, что в каждом ящике находится хотя бы один предмет. Количество таких раскладок при $k>n$ равно, очевидно, нулю. Задача следующего пункта данного параграфа --- сосчитать количество этих раскладок для случая $0\leq k\leq n$.


\myitem Обозначим через $\hat{S}(n,k)$ количество всех сюръективных отображений $n$-элементного множества $X$ в $k$-элементное множество $Y$. Сосчитаем $\hat{S}(n,k)$ для случая $n\geq 0$, $0\leq k\leq n$.

\mysubitem Рассмотрим множество \emph{всех} отображений из $n$-множества $X$ в $k$-множество $Y$. Как мы знаем, количество таких отображений равно $k^n$. Наша задача состоит в том, чтобы подсчитать это количество по-другому, выразив $k^n$ через числа $\hat{S}(n,k)$.

\mysubitem Заметим, что \emph{любое} отображение $f\colon X\to Y$ можно рассматривать как \emph{сюръективное}
отображение множества $X$ на множество
$$
\Im (f)=\{y\in Y\mid\exists x\colon\,y=f(x)\},
$$
являющееся образом множества $X$ при отображении $f$.

Так, для отображения $f$ из примера \ref{examp:any_f} образ $\Im(f)=\{y_2,y_4\}$, а отображение $f\colon X\to Y$ является сюръективным отображением множества $X$ на подмножество $\Im (f)\subset Y$.

\mysubitem Разобъем теперь все множество отображений $f\colon X\to Y$ на блоки, включив в $i$-й блок все отображения, образ $\Im(f)$ которых содержит ровно $i$ элементов: $|\Im(f)|=i$, $i=1,\ldots,k$. Все, что нам остается --- это сосчитать количество элементов в каждом блоке, а затем воспользоваться правилом суммы для того, чтобы получить общее количество $k^n$ всех отображений.

\mysubitem Заметим, что существует $\BCf{k}{i}$ способов выбрать $i$-элементное подмножество $k$-множества $Y$. Для каждого из этих подмножеств имеется $\hat{S}(n,i)$ различных сюръективных отображений из $n$-элементного множества $X$ в выбранное $i$-элементное подмножество множества $Y$. Таким образом, по правилу произведения, общее количество элементов в $i$-м блоке равно
$$
\BCf{k}{i}\cdot \hat{S}(n,i).
$$
Тогда по правилу суммы можем записать, что
\begin{equation}
\label{eq:Morg_num_k_dir}
k^n=\sum\limits_{i=0}^k\BCf{k}{i}\cdot \hat{S}(n,i).
\end{equation}

\begin{rem}
Формулу (\ref{eq:Morg_num_k_dir}) полезно иногда записывать в виде
\begin{equation}
\label{eq:Morg_num_n_dir}
k^n=\sum\limits_{i=0}^n\BCf{k}{i}\cdot \hat{S}(n,i).
\end{equation}
Несложно убедиться в том, что эта формула непосредственно следует из (\ref{eq:Morg_num_k_dir}), а также в том, что она оказывается справедливой как для случая $n\geq k$, так и для случая $n<k$.
\end{rem}

\mysubitem Мы выразили количество всех отображений $n$-элементного множества $X$ в $k$-элементное множество $Y$ через количество $\hat{S}(n,i)$ сюръективных отображений. Нам же нужна обратная формула, выражающая количество $\hat{S}(n,k)$ сюръективных отображений через число $i^n$ всех отображений. Для ее получения воспользуемся так называемыми \emph{формулами обращения.}

\begin{propos} \label{propos:form_obr}
Пусть $(f_0,f_1,f_2,\ldots)$ и $(g_0,g_1,g_2,\ldots)$ --- две числовые последовательности, и пусть одна из них выражается через вторую по формулам
\begin{equation}
\label{eq:form_obr_dir}
f_k=\sum\limits_{i=0}^k \BCf{k}{i}\,g_i,\qquad k\geq 0.
\end{equation}
Тогда справедлива следующая формула обращения:
\begin{equation}
\label{eq:form_obr_obr}
g_k=\sum\limits_{i=0}^k(-1)^{k-i} \BCf{k}{i}\,f_i,\qquad k\geq 0.
\end{equation}
\end{propos}

С учетом этих формул обращения можно, считая $n$ параметром, из соотношения (\ref{eq:Morg_num_k_dir}) получить следующую явную формулу для вычисления чисел $\hat{S}(n,k):$
$$
\hat{S}(n,k)=\sum\limits_{i=0}^k(-1)^{k-i}\BCf{k}{i}\cdot i^n.
$$


\myitem Задачи подсчета количества отображений $n$-элементного множества $X$ в $k$-элементное множество $Y$ имеют еще одну важную комбинаторную интерпретацию.

\mysubitem Начнем с простого примера. 
\begin{examp} 
Для трехэлементного множества $X=\{x_1,x_2,x_3\}$ и двухэлементного множества $Y=\{y_1,y_2\}$ имеется, как мы знаем, $2^3=8$ различных отображений множества $X$ в множество $Y$. Запишем все эти отображения как упорядоченные пары подмножеств множества $X$:
$$
(\{x_1,x_2,x_3\},\emptyset),\qquad
(\{x_1,x_2\},\{x_3\}),\qquad
(\{x_1,x_3\},\{x_2\}),\qquad
(\{x_2,x_3\},\{x_1\}),
$$
$$
(\{x_1\},\{x_2,x_3\}),\qquad
(\{x_2\},\{x_1,x_3\}),\qquad
(\{x_3\},\{x_1,x_2\}),\qquad
(\emptyset,\{x_1,x_2,x_3\}).
$$
Видно, что записанное в таком виде решение представляет собой не что иное, как список всех возможных \emph{разделений} множества $X$, то есть упорядоченных разбиений $X$ на два блока, один из которых может быть и пустым.
\end{examp}

\mysubitem Очевидно, что данный результат справедлив и в общем случае. Именно, любое отображение $f\colon X\to Y$ задает нам некоторое разделение множества $X$, то есть разбиение этого множества на $k$ упорядоченных блоков, часть из которых могут быть пустыми. Как следствие, количество таких разделений совпадает с количеством всех отображений $f$ и равно $k^n$.

Аналогичные рассуждения показывают, что любое сюръективное отображение $f\colon X\to Y$ задает нам некоторое \emph{упорядоченное разбиение} множества $X$ на блоки. Поэтому количество всех упорядоченных разбиений $n$-элементного множества $X$ на $k$ блоков равно числу $\hat{S}(n,k)$.


\mysubitem Рассмотрим теперь некоторый специальный вид $k$-разделений множества $X$, а именно, такие $k$-разделения, в которых в первом блоке содержится $a_1$ элемент, во втором блоке --- $a_2$ элемента, в $k$-м блоке --- $a_k$ элементов. Очевидно, что при этом общая сумма всех элементов должна быть равна мощности $|X|=n$:
$$
a_1+a_2+\ldots+a_k=n,\qquad a_i\geq 0.
$$

\begin{propos} Количество всех таких $k$-разделений $n$-множества $X$ равно
\begin{equation}
\label{eq:razd_a1_ak}
P(n;a_1,a_2,\ldots,a_k):=\BCf{n}{a_1}\cdot\BCf{n-a_1}{a_2}\cdot\ldots\cdot\BCf{n-a_1-a_2-\ldots-a_{k-1}}{a_k}=
\dfrac{n!}{a_1!\cdot a_2!\cdot\ldots\cdot a_k!}.
\end{equation}
\end{propos}

\evidp Действительно, из любого $n$-элементного множества $X$ мы $\BCf{n}{a_1}$ способами можем выбрать $a_1$ элементов и положить их в первый ящик (отнести к первому блоку разбиения). Затем для каждого такого выбора мы $\BCf{n-a_1}{a_2}$ способами можем из оставшегося $(n-a_1)$-элементного множества выбрать $a_2$ элементов и положить их во второй ящик (отнести ко второму блоку разбиения), и так далее. Формула (\ref{eq:razd_a1_ak}), описывающая общее количество способов совершить все эти действия, следует теперь из правила произведения. \qed

\begin{conseq} Общее количество $k^n$ всех $k$-разделений $n$-множества $X$ выражается через числа $P(n;a_1,a_2,\ldots,a_k)$ по формуле
\begin{equation}
\label{eq:k_n_division}
k^n=\sum_{\substack{a_1+a_2+\ldots+a_k=n\\a_i\geq 0}}P(n;a_1,a_2,\ldots,a_k)=
\sum_{\substack{a_1+a_2+\ldots+a_k=n\\a_i\geq 0}}\dfrac{n!}{a_1!\cdot a_2!\cdot\ldots\cdot a_k!}.
\end{equation}
\end{conseq} 

\begin{rem} Если в условии рассматриваемой задачи заменить нестрогие неравенства $a_i\geq 0$ на строгие, то есть на неравенства $a_i>0$, то вместо разделения мы получим упорядоченное разбиение специального вида. Количество таких упорядоченных разбиений также описывается формулой (\ref{eq:razd_a1_ak}), а вместо формулы (\ref{eq:k_n_division}) получается не менее полезное соотношение вида
\begin{equation}
\label{eq:k_n_ord_partition}
\hat{S}(n,k)=\sum_{\substack{a_1+a_2+\ldots+a_k=n\\a_i> 0}}\dfrac{n!}{a_1!\cdot a_2!\cdot\ldots\cdot a_k!}.
\end{equation}
\end{rem}


\myitem Числа $P(n;a_1,a_2,\ldots,a_k)$ имеют и еще один важный комбинаторный смысл. Именно, они перечисляют
так называемые \emph{перестановки $n$-множества $X$ с повторениями.}

\mysubitem Рассмотрим в качестве элементарного примера следующую задачу: на полке имеются $15$ различных книг по математике, $16$ по информатике и $12$ по физике; каково количество способов перестановки этих книг на полке? Ответ очевиден: $(15+16+12)!=43!$ способов.

Предположим теперь, что мы перестали различать книги, посвященные одному и тому же предмету. В этом случае количество различных способов перестановки таких книг уменьшится. Обозначим это количество через $\lambda_n$. Так как существует $15!$ способов упорядочить книги по математике, $16!$ -- по информатике и $12!$ -- по физике, то по правилу произведения мы можем записать, что
$$
43!=\lambda_n\cdot 16!\cdot 15!\cdot 12!\qquad \Longrightarrow
\qquad \lambda_n=\dfrac{43!}{16!\cdot 15!\cdot 12!}=P(43;15,16,12).
$$

\mysubitem Аналогичные рассуждения справедливы и в общем случае. Именно, пусть среди $n$ переставляемых предметов имеется $a_1$ неразличимых предметов первого сорта, $a_2$ неразличимых предметов второго сорта и так далее, причем $a_1+a_2+\ldots+a_k=n$. Тогда для количества перестановок таких предметов с повторениями получаем уже знакомую нам формулу
$$
\dfrac{n!}{a_1!\cdot a_2!\cdot\ldots\cdot a_k!}=P(n;a_1,a_2,\ldots,a_k).
$$

\mysubitem В частном случае перестановки $n$ предметов двух различных сортов получаем
$$
P(n;k,n-k)=\dfrac{n!}{k!\cdot (n-k)!}=\BCf{n}{k}.
$$
Иными словами, количество таких перестановок совпадает с количеством различных $k$-эле\-мент\-ных подмножеств $n$-элементного множества. Для комбинаторного доказательства данного факта можно воспользоваться рассуждениями, которые мы проводили при подсчете количества всех подмножеств данного множества. Напомним, что там мы любое подмножество кодировали упорядоченной битовой строкой длины $n$, состоящей из $k$ единиц и $(n-k)$ нулей. Осталось заметить, что любая такая строка представляет собой некоторую перестановку $k$ элементов первого сорта (единиц) и $(n-k)$ элементов второго сорта (нулей). 

\mysubitem В заключение отметим еще одну полезную биекцию, позволяющую несколько по-другому сосчитать количество $k$-мультимножеств $n$-элементного множества. Мы знаем, что любому $k$-мультимножеству над $n$-множеством отвечает некоторая раскладка $k$ неразличимых предметов по $n$ различимым ящикам. В свою очередь, любую такую раскладку можно рассматривать как упорядоченный набор, состоящий из $k$ неразличимых предметов одного сорта (например, $k$ неразличимых шаров), и $(n-1)$-го предмета второго сорта ($(n-1)$-й неразличимой перегородки между этими шарами). Как следствие, количество всех $k$-мультимножеств
$$
\BCCf{n}{k}=P(k+n-1;k,n-1)=\dfrac{(n+k-1)!}{(n-1)!\cdot k!}=\BCf{n+k-1}{k}.
$$

\myitem Вернемся к числам $\hat{S}(n,k),$ описывающим, в частности, количество всех упорядоченных разбиений $n$-множества на $k$ блоков. Обозначим теперь  через $S(n,k)$ количество обычных, неупорядоченных разбиений $n$-множества на $k$ блоков. Так как для любого неупорядоченного разбиения существует $k!$ способов упорядочить $k$ его блоков, то
$$
\hat{S}(n,k)=k!\,S(n,k).
$$
Отсюда с учетом (\ref{eq:Morg_num_k_dir}) и (\ref{eq:k_n_ord_partition}) получаем следующие две явные формулы, позволяющие вычислять числа $S(n,k)$:
\begin{equation}
\label{eq:Num_Stir_2_rod}
S(n,k)=\dfrac{1}{k!}\sum\limits_{i=0}^k(-1)^k\BCf{k}{i}(k-i)^n=\dfrac{1}{k!}
\sum_{\substack{a_1+a_2+\ldots+a_k=n\\a_i> 0}}\dfrac{n!}{a_1!\cdot a_2!\cdot\ldots\cdot a_k!}.
\end{equation}
Числа $S(n,k)$ называются \emph{числами Стирлинга второго рода} и встречаются в большом количестве комбинаторных приложений. Исследуем эти числа поподробнее.

\mysubitem Для практического расчета чисел $S(n,k)$ удобно использовать рекуррентные соотношения. 

\begin{propos} Числа Стирлинга второго рода удовлетворяют следующим рекуррентным соотношениям:
\begin{equation}
\label{eq:Num_Stir_2_rod_recur}
S(n,k)=S(n-1,k-1)+k\cdot S(n-1,k),\qquad k=1,\ldots,n;
\end{equation}
$$
S(0,0)=1;\qquad S(n,0)=0\quad\forall \,\,n>0;\qquad S(n,k)=0\quad\forall \,\,k>n.
$$
\end{propos}

\evidp Граничные условия $S(n,0)=0$ для всех $n>0$ и $S(n,k)=0$ для всех $k>n$ очевидны --- $n$-элементное множество  в случае $n>0$ нельзя разбить на $0$ блоков, а также на $k$ блоков в случае, когда $k>n$. Равенство $S(0,0)=1$ введено просто для удобства. 

Докажем теперь соотношение (\ref{eq:Num_Stir_2_rod_recur}). Разобьем для этого множество всех $k$-разбиений на два блока. К первому блоку $\Sigma_1$ отнесем все разбиения, содержащие одноэлементное подмножество $\{x_1\}$. Ко второму блоку $\Sigma_2$ отнесем все оставшиеся $k$-разбиения, т.е. разбиения, в которых элемент $x_1$ входит в подмножества, содержащие как минимум два элемента. 

Рассмотрим, к примеру, все $2$-разбиения множества $X=\{x_1,x_2,x_3,x_4\}$:
$$
\{\{x_1,x_2,x_3\},\{x_4\}\},\quad
\{\{x_1,x_2,x_4\},\{x_3\}\},\quad
\{\{x_1,x_3,x_4\},\{x_2\}\},\quad
\{\{x_2,x_3,x_4\},\{x_1\}\},
$$
$$
\{\{x_1,x_2\},\{x_3,x_4\}\},\quad
\{\{x_1,x_3\},\{x_2,x_4\}\},\quad
\{\{x_1,x_4\},\{x_2,x_3\}\}.
$$
Для этого примера к первому блоку относится единственное разбиение вида $\{\{x_2,x_3,x_4\},\{x_1\}\}$. Остальные шесть разбиений относятся в данном случае ко второму блоку. 

Довольно очевидно, что количество элементов в первом блоке равно количеству $S(n-1,k-1)$ всех $(k-1)$-разбиений оставшегося $(n-1)$-элементного множества. В примере это число равно $S(3,1)=1$ --- любое множество можно только одним способом разбить на один блок. 

Для подсчета количества элементов во втором блоке заметим, что, по сути дела, это число равно количеству всевозможных разбиений $(n-1)$-элементного множества на $k$ непустых подмножеств с поочередным добавлением элемента $x_1$ в каждое из этих подмножеств. Действительно, для разобранного выше примера имеется три разбиения трехэлементного множества $\{x_2,x_3,x_4\}$ на два непустых подмножества, а именно, разбиения вида
$$
\{\{x_2\},\{x_3,x_4\}\},\quad
\{\{x_3\},\{x_2,x_4\}\},\quad
\{\{x_4\},\{x_2,x_3\}\}.
$$
Добавляя к каждому из этих подмножеств элемент $x_1$, получим $2\cdot 3=6$ выписанных выше разбиений четырехэлементного множества $X$ на блоки требуемого вида. Количество таких разбиений в общем случае равно, очевидно, $k\cdot S(n-1,k)$. \qed

\begin{figure}[h]
\centering
  \includegraphics[scale=0.5]{pics/stirling_triangle.eps}
\caption{Графическое представление чисел $S(n,k)$}
\label{fig:stirling_triangle}
\end{figure}

\mysubitem Как и биномиальные коэффициенты, числа Стирлинга второго рода удобно представлять в виде треугольного массива на плоскости $(n,k)$. На рис.\ref{fig:stirling_triangle} показаны первые несколько строк такого массива, вычисленных с помощью рекуррентных соотношений (\ref{eq:Num_Stir_2_rod_recur}). Такой рисунок дает нам еще одну комбинаторную интерпретацию чисел $S(n,k)$ --- это есть количество \emph{взвешенных} путей, идущих из начала координат в точку с координатами $(n,k)$. 

\mysubitem Числа Стирлинга второго рода встречается в очень большом количестве самых разнообразных задач. В качестве примера вернемся к формуле (\ref{eq:Morg_num_n_dir}) и перепишем ее через числа Стирлинга второго рода:
\begin{equation}
\label{eq:k_n_Stirl_2}
k^n=\sum\limits_{i=0}^n\BCf{k}{i}\cdot i!\cdot S(n,i)=
\sum\limits_{i=0}^n (k)_i\cdot S(n,i).
\end{equation}
Оказывается, эта формула справедлива для любых вещественных и даже комплексных значений $k$. Именно, справедливо равенство
$$
x^n=\sum\limits_{i=0}^n (x)_i\cdot S(n,k).
$$
Эта формула активно используется в теории конечных операторов --- она позволяет перейти от базиса $x^n$ к базису $(x)_n$.


\mysubitem С точки зрения схемы раскладки предметов по ящикам числа Стирлинга второго рода описывают количество способов разложить $n$ различимых предметов по $k$ неразличимым ящикам так, чтобы в любом ящике содержался хотя бы один предмет. Сосчитаем, зная $S(n,k)$, количество $B(n,k)$ различных раскладок $n$ различимых предметов по $k$ неразличимым ящикам в случае, когда ограничения на количество предметов в любом ящике отсутствуют.

Для этого вновь разобьем множество всех таких раскладок на блоки, поместив в $i$-й блок все раскладки, в которых занято ровно $i$ ящиков. В случае различимых ящиков в процессе аналогичного разбиения множества на блоки мы в $i$-м блоке имели $\BCf{k}{i}\cdot \hat{S}(n,i)$ элементов. В случае неразличимых ящиков мы $i$ из $k$ ящиков выбираем ровно одним способом, а затем $S(n,i)$ способами заполняем эти ящики $n$ предметами. Используя правило суммы, получаем отсюда следующее выражение для чисел $B(n,k)$:
$$
B(n,k)=\sum\limits_{i=1}^kS(n,i).
$$

\mysubitem Числа $B(n,k)$ в случае $n=k$ называются числами Белла $B(n)$. Эти числа перечисляют количество \emph{всех} возможных разбиений $n$-элементного множества $X$. 

Заметим, что любое разбиение множества $X$ можно получить, введя на этом множестве некоторое отношение эквивалентности. Как следствие, количество всех возможных отношений эквивалентности на $n$-элементном множестве $X$ описывается числами Белла $B_n$.



\myitem Подведем итоги, построив таблицу различных схем раскладок $n$ предметов по $k$ ящикам:

$$
\begin{array}{|c|c|c|c|c|}%{|p{3cm}|p{3cm}|p{3cm}|p{3cm}|p{3cm}|}
\hline
\mbox{Элементы}          &\mbox{Элементы}
& \mbox{Произвольное}&
\mbox{Не более} &
\mbox{Как минимум} \\
\mbox{множества $X$}          &\mbox{множества $Y$}
& \mbox{количество предметов}&
\mbox{$1$ предмета} &
\mbox{$1$ предмет} \\
\mbox{(предметы)}          &\mbox{(ящики)}
& \mbox{в ящике}&
\mbox{в ящике} &
\mbox{в ящике} \\[2pt]
\hline
\vphantom{\Biggl(\Biggr)}\mbox{различимые} &  \mbox{различимые}
 & k^n & (k)_n & \hat{S}(n,k)   \\[2pt]
\hline
\vphantom{\Biggl(\Biggr)}\mbox{неразличимые} &  \mbox{различимые}  &
\vphantom{\Biggl(\Biggr)}\BCCf{k}{n}  &
\vphantom{\Biggl(\Biggr)}\BCf{k}{n} &
\vphantom{\Biggl(\Biggr)}\BCf{n-1}{k-1}  \\[2pt]
\hline
\vphantom{\Biggl(\Biggr)}\mbox{различимые} &  \mbox{неразличимые}  & B(n,k)  &
\begin{aligned} 0,\quad n>k\\ 1,\quad n\leq k\end{aligned}  &
 S(n,k)  \\[2pt]
\hline
\end{array}
$$

Как видно, остался еще один неразобранный вариант --- схема размещения $n$ неразличимых предметов
по $k$ неразличимым ящикам. Для количества таких размещений явных аналитических формул не
существует. Для того, чтобы их перечислить, необходимо использовать аппарат производящих функций,
к изучению которого мы приступим в одном из следующих параграфов.

\section*{Упражнения}

\begin{exerc} 
Доказать справедливость формулы (\ref{eq:Morg_num_n_dir}) для любого $n\in\Z_+$.
\end{exerc}

\begin{exerc} 
Доказать формулу обращения \ref{propos:form_obr}.
\end{exerc}

\begin{exerc} 
Получить комбинаторно явные аналитические выражения для чисел $\hat{S}(n,2)$ и $\hat{S}(n,n-2)$. 
\end{exerc}

\begin{exerc}
В начале учебного года на кафедре происходит распределение нагрузки. Имеется $5$ преподавателей и $7$ различных групп студентов, которым эти преподаватели должны прочитать один и тот же курс. Любой преподаватель может вести занятия в любой группе. Подсчитать количество способов распределения нагрузки между преподавателями при условии, что каждый преподаватель должен вести занятия хотя бы в одной группе.
\end{exerc}

\begin{exerc} 
Сосчитать количество размещений $n$ различимых предметов по $k$ различимым ящикам при условии, что ровно $r$ из $k$ ящиков должны быть заняты.
\end{exerc}

\begin{exerc} 
Сколько разных слов можно получить, переставляя буквы слов а) ``математика''; б) ``комбинаторика''?
\end{exerc}

\begin{exerc} 
Найти сумму четырехзначных чисел, которые можно получить при всевозможных перестановках цифр а) $1,2,3,4$; б) $1,2,2,5$. 
\end{exerc}

\begin{exerc} 
Сколькими способами можно расставить $20$ различных книг по пяти полкам при условии, что каждая полка может вместить все эти двадцать книг? 
\end{exerc}

\begin{exerc} 
Сколькими способами можно из $60$ различных грибов сделать четыре связки по пятнадцать грибов в каждой? 
\end{exerc}

\begin{exerc} 
Выписать явные аналитические выражения для чисел Стирлинга $S(n,1)$, $S(n,n)$ и $S(n,n-1)$. 
\end{exerc}

\begin{exerc} 
Придумать комбинаторное доказательство формулы (\ref{eq:k_n_Stirl_2}). 
\end{exerc}

\begin{exerc} 
Доказать справедливость следующей рекуррентной формулы для чисел Белла:
\begin{equation}
\label{eq:Bell_req}
B_{n+1}=\sum\limits_{k=0}^n\BCf{n}{k}B_k.
\end{equation}
\end{exerc}

\begin{exerc} 
Доказать, что количество способов раскладки $n$ различимых предметов по $k$ неразличимым ящикам при условии, что в каждом ящике находится не более одного предмета, равно $0$ в случае $n>k$ и $1$ в случае $n\leq k$.
\end{exerc}

\section*{Решение упражнений}

\begin{sol_exerc} 
Действительно, в случае $n\geq k$ имеем
$$
\sum\limits_{i=0}^n\BCf{k}{i}\cdot \hat{S}(n,i)=
\sum\limits_{i=0}^k\BCf{k}{i}\cdot \hat{S}(n,i)+
\sum\limits_{i=k+1}^n\BCf{k}{i}\cdot \hat{S}(n,i)=
\sum\limits_{i=0}^k\BCf{k}{i}\cdot \hat{S}(n,i)
$$
за счет того, что биномиальные коэффициенты $\BCf{k}{i}=0$ для всех $i>k$. В случае же $n<k$
$$
\sum\limits_{i=0}^k\BCf{k}{i}\cdot \hat{S}(n,i)=
\sum\limits_{i=0}^n\BCf{k}{i}\cdot \hat{S}(n,i)+
\sum\limits_{i=n+1}^k\BCf{k}{i}\cdot \hat{S}(n,i)=
\sum\limits_{i=0}^n\BCf{k}{i}\cdot \hat{S}(n,i)
$$
уже за счет того, что при $i>n$ все числа $\hat{S}(n,i)=0$.
\end{sol_exerc}

\begin{sol_exerc}  
Доказательство этой формулы можно провести, например, так:
$$
\sum\limits_{i=0}^k\BCf{k}{i}\,g_i=\sum\limits_{i=0}^k \BCf{k}{i}\,\sum\limits_{j=0}^i(-1)^{j-i} \BCf{i}{j}\,f_j=
\sum\limits_{j=0}^k f_j\,\sum\limits_{i=j}^k(-1)^{j-i} \BCf{k}{i} \BCf{i}{j}=
$$
$$
=\sum\limits_{j=0}^k\BCf{k}{j} f_j\,\sum\limits_{i=j}^k(-1)^{j-i} \BCf{k-j}{i-j}=
\sum\limits_{j=0}^k\BCf{k}{j} f_j\,\sum\limits_{l=0}^{k-j}(-1)^{-l} \BCf{k-j}{l}.
$$
Внутренняя сумма равна нулю для всех $k-j>0$. В случае $k=j$ она равна единице, и поэтому 
$$
\sum\limits_{i=0}^k\BCf{k}{i}\,g_i=f_k.
$$
\end{sol_exerc}

\begin{sol_exerc}  
Существует ровно $2^n$ разделений множества на два упорядоченных, возможно пустых блока. Исключая из них два случая разделений с пустыми блоками, получаем $\hat{S}(n,2)=2^n-2$ упорядоченных разбиений множества $X$ на два блока. 

Всего существует $3^n$ различных отображений $n$-элементного множества $X$ в трехэлементное множество $Y$. Из них ровно три отображают $X$ в одноэлементное подмножество, и $3\cdot \hat{S}(n,2)=3(2^n-2)$ из них отвечают функциям, у которых образ совпадает либо с подмножеством $\{y_1,y_2\}$, либо с подмножеством $\{y_1,y_3\}$, либо с подмножеством $\{y_2,y_3\}$. У остальных функций образ совпадает со всем множеством $Y$. Следовательно,
$$
\hat{S}(n,3)=3^n-3(2^n-2)-3=3(3^{n-1}-2^n+1).
$$
\end{sol_exerc}


\begin{sol_exerc} С формальной точки зрения речь идет о подсчете количества сюръективных отображений $7$-элементного множества $X$ в пятиэлементное множество $Y$. Это количество равно $\hat{S}(7,5)$. Для его расчета можно, например, воспользоваться формулой (\ref{eq:k_n_ord_partition}). Число $7$ можно разбить на пять слагаемых следующими двумя способами:
$$
7=2+2+1+1+1=3+1+1+1+1.
$$ 
Первому разбиению отвечают $\BCf{5}{2}=10$ способов выбора двух преподавателей из пяти, читающих по две лекции. Второму разбиению соответствует $\BCf{5}{1}=5$ способов выбора преподавателя, ведущего у трех групп студентов. Тогда общее количество вариантов равно
$$
\hat{S}(7,5)=10\cdot P(7;2,2)+5\cdot P(7;3)=16\,800.
$$
\end{sol_exerc}


\begin{sol_exerc}  
Количество способов выбрать $r$ ящиков из $k$ равно $\BCf{k}{r}$. Для каждого такого способа существует $\hat{S}(n,r)$ вариантов разместить $n$ предметов по $r$ ящикам. Следовательно, по правилу произведения, всего имеется $\BCf{k}{r}\,\hat{S}(n,r)$ искомых размещений. 
\end{sol_exerc}


\begin{sol_exerc} Количество различных слов равняется количеству перестановок $n$ элементов (букв в слове) с повторениями. Поэтому из слова ``математика'' можно составить
$$
P(10;3,2,2)=\dfrac{10!}{3!\,2!\,2!},
$$
вариантов слов, а из слова  ``комбинаторика'' 
$$
P(13;2,2,2)=\dfrac{13!}{2!\,2!\,2!}
$$
различных слов.
\end{sol_exerc}

\begin{sol_exerc} В первом случае имеется $4!$ перестановок цифр $1,2,3,4$ в числе, состоящем из этих четырех цифр, причем каждая цифра может встречаться в каждом разряде этого числа одинаковое число раз, а точнее, $6$ раз. Складывая всевозможные числа $i$-го разряда, получаем $6\cdot(1+2+3+4)=60$. Следовательно, сумма всех чисел, состоящих из цифр $1,2,3,4$, равна
$$
60\cdot 10^0+60\cdot 10^1+60\cdot 10^2+60\cdot 10^3=66\,600.
$$
Во втором случае количество различных перестановок равно $P(4;2,1,1)=12$. Цифры $1$ и $5$ в каждом разряде могут встречаться три раза, а цифра $2$ --- шесть раз. Следовательно, сумма чисел, получающихся в результате всех таких перестановок, равна
$$
(1\cdot 3+5\cdot 3+2\cdot 6)\cdot 10^0+30\cdot 10^1+30\cdot 10^2+30\cdot 10^3=33\,330.
$$
\end{sol_exerc}

\begin{sol_exerc}  
Добавим к двадцати книгам четыре одинаковые разделяющие перегородки. Тогда любая перестановка книг и перегородок даст нам модель расстановки книг по пяти полкам. Таких перестановок существует $24!/4!$ штук. 
\end{sol_exerc}

\begin{sol_exerc}  
Количество способов составить четыре различимые связки из этих грибов равны $P(60;15,15,15,15)$. Однако мы эти связки не различаем, поэтому окончательный ответ есть
$$
\dfrac{60!}{(15!)^4\cdot 4!}.
$$ 
\end{sol_exerc}

\begin{sol_exerc} Очевидно, что для всех натуральных значений $n$ числа $S(n,1)=S(n,n)=1$: существует единственное разбиение множества на один блок --- это само это множество, а также на $n$ блоков --- это $n$ элементов этого множества. 

Любое разбиение $X$ на $(n-1)$ блок должно содержать ровно один блок, состоящий из двух элементов. Следовательно, количество $S(n,n-1)$ таких разбиений совпадает с количеством двухэлементных подмножеств множества $X$ и равно $\BCf{n}{2}$. 
\end{sol_exerc}

\begin{sol_exerc}  
Множество всех отображений $n$-элементного множества $X$ в $k$-элементное множество $Y$ можно разделить на блоки, поместив в $i$-й блок отображения, принимающие ровно $i$ разных значений. Разобъем теперь $S(n,i)$ способами множество $X$ на $i$ блоков и припишем каждому блоку $i$ различных значений. Последнее можно сделать $(k)_i$ способами. Следовательно, имеется $(k)_i\cdot S(n,i)$ функций, принимающих ровно $i$ разных значений. Теперь (\ref{eq:k_n_Stirl_2}) следует из правила суммы.   
\end{sol_exerc}

\begin{sol_exerc}  Рассмотрим множество $\Sigma$ всех разбиений множества $X=\{1,2,\ldots,n,n+1\}$. Обозначим через $\Sigma_i$ подмножество $\Sigma$ таких разбиений, в которых элемент $(n+1)$ входит в блок размерами $(n+1-i)$, $i=0,\ldots,n$. Существует $\BCf{n}{n-i}=\BCf{n}{i}$ вариантов выбора элементов $X$, входящих в один блок с элементом $(n+1)$, и для каждого такого выбора имеется $B(i)$ способов разбить оставшееся множество из $i$ элементов на блоки. Так как подмножества $\Sigma_i$ попарно не пересекаются, а их объединение дает нам все $\Sigma$, то  (\ref{eq:Bell_req}) следует из правила суммы. 
\end{sol_exerc}

\begin{sol_exerc} В случае, когда предметов больше, чем ящиков, требуемой раскладки не существует --- согласно принципу Дирихле, в одном из ящиков окажется хотя бы два предмета. В обратном случае, то есть в случае, когда предметов не больше, чем ящиков, любые две раскладки $n$ различимых предметов по $k$ неразличимым ящикам эквивалентны друг другу. Как следствие, существует единственный способ такой раскладки. 
\end{sol_exerc}



\section{Рекуррентные соотношения}

\myitem Мы уже несколько раз получали решения комбинаторных задач, записанные в виде тех или иных рекуррентных соотношений. Настало время поговорить о них немного поподробнее.

\mysubitem Начнем с простого примера \cite{Bona}. 

\begin{examp} \label{examp:Bona_frog}
Популяция лягушек в озере увеличивается в четыре раза каждый год. В последний день каждого года $100$ лягушек отлавливают и переправляют на другие озера. Предполагая, что в начале первого года в озере было $50$ лягушек, найти количество лягушек в начале любого последующего года.
\end{examp}

\decis Обозначим через $a_n$ количество лягушек в начале $(n+1)$-го года. По условию задачи, $a_0=50$. Тогда, очевидно,
$$
a_1=4\cdot 50-100=100,\qquad a_2=4\cdot 100 - 100 = 300,
$$
а в общем случае
$$
a_{n+1}=4\cdot a_n-100,\qquad n=0,1,2,\ldots
$$
Полученное равенство является простейшим примером \emph{рекуррентного соотношения.}

\mysubitem Перейдем теперь к формальным определениям.

\begin{defin} Пусть $a_0,a_1,a_2,\ldots$ --- произвольная числовая последовательность. Если для любого $n\geq m$ число $a_{n+m}$ является некоторой функцией от $m$ предыдущих членов последовательности, т.е.
\begin{equation}
\label{eq:req_tot}
a_{n+m}=f(a_n,a_{n+1},\ldots,a_{n+m-1}),
\end{equation}
то такая последовательность называется рекуррентной последовательностью, а соотношение (\ref{eq:req_tot}) --- рекуррентным соотношением $m$-го порядка.
\end{defin}

В частном случае линейной функции $f$ имеем так называемое \emph{линейное рекуррентное соотношение}
\begin{equation}
\label{eq:req_lin}
a_{n+m}=b_1(n)\,a_{n+m-1}+b_2(n)\,a_{n+m-2}+\ldots+ b_{m-1}(n)\,a_{n+1}+b_m(n)\,a_n+u_n.
\end{equation}
В случае $u_n=0$ оно называется \emph{однородным,} в противном случае --- \emph{неоднородным.}

Самый простой случай рекуррентного соотношения (\ref{eq:req_lin}) --- это \emph{линейное однородное рекуррентное соотношение с постоянными коэффициентами}
\begin{equation}
\label{eq:req_lin_const}
a_{n+m}=b_1\,a_{n+m-1}+b_2\,a_{n+m-2}+\ldots+ b_{m-1}\,a_{n+1}+b_m\,a_n.
\end{equation}

Очевидно, что для однозначного определения всех $a_n$ необходимо наряду с самим рекуррентным соотношением (\ref{eq:req_tot}) задать и первые $m$ членов $a_0,a_1,\ldots,a_{m-1}$ данной последовательности, то есть, как говорят, \emph{задать начальные условия} для рекуррентного соотношения.

\mysubitem Итак, наличие рекуррентного соотношения и начальных условий позволяет нам последовательно, шаг за шагом, определить любое наперед заданное количество $n$ членов рекуррентной числовой последовательности. Зачастую это все, что нам требуется от задачи. Иными словами, получение рекуррентного соотношения для искомой числовой последовательности $a_n$ является вполне приемлемым, а зачастую --- и наиболее удобным с вычислительной точки зрения ответом для поставленной комбинаторной задачи.

Однако иногда нам хочется получить явное аналитическое выражение для общего члена $a_n$ этой последовательности, или, как говорят, \emph{решить} данное рекуррентное соотношение. Мы в данном параграфе покажем, как построить такое решение в случае линейного однородного рекуррентного соотношения с постоянными коэффициентами (\ref{eq:req_lin_const}).

\myitem Прежде чем рассматривать общий случай уравнения (\ref{eq:req_lin_const}), рассмотрим наиболее простой его вариант --- линейное однородное рекуррентное соотношение первого порядка
\begin{equation}
\label{eq:lin_rec_1}
a_{n+1}=b_1\cdot a_n,\qquad n=0,1,2,\ldots; \qquad \text{$a_0$ --- заданное число}.
\end{equation}

\mysubitem Решение этого уравнения построить легко. Действительно,
$$
a_1=b_1\cdot a_0;\qquad a_2=b_1\cdot  a_1=b_1^2\cdot a_0;\qquad\ldots\qquad a_n=b_1^n\cdot a_0.
$$

\mysubitem Предположим теперь, что нам кто-то сразу подсказал вид решения, а именно, что решение нашего уравнения (\ref{eq:lin_rec_1}) степенным образом зависит от $n$:
$$
a_n=r^n\qquad \text{для некоторого $r$.}
$$
Воспользовавшись этой подсказкой, подставим это выражение в исходное рекуррентное соотношение (\ref{eq:lin_rec_1}). В результате получается равенство вида
$$
r^{n+1}=b_1\cdot r^n,
$$
из которого сразу же следует, что $r=b_1$; при этом $a_n$ оказывается равным $b_1^n$. Это означает, что при $n=0$ число $a_0=b_1^0=1$. Иными словами, $a_n=b_1^n$ есть решение исходной задачи (\ref{eq:lin_rec_1}) в частном случае $a_0=1$. Поэтому такое решение называется \emph{частным решением} уравнения (\ref{eq:lin_rec_1}).

\mysubitem Теперь попытаемся, зная частное решение, построить общее решение задачи (\ref{eq:lin_rec_1}). Для этого заметим, что в силу однородности уравнения (\ref{eq:lin_rec_1}) любое его частное решение, умноженное на произвольную постоянную $c$, по-прежнему этому уравнению удовлетворяет:
$$
c\cdot b_1^{n+1}\equiv c\cdot b_1\cdot b_1^n.
$$
Решение же вида $c\cdot b_1^n$ позволяет удовлетворить любому начальному условию. Действительно, подставляя его в начальное условие для уравнения (\ref{eq:lin_rec_1}), получим:
$$
c\cdot b_1^0=a_0\qquad \Longrightarrow \qquad c=a_0\qquad \Longrightarrow \qquad a_n=a_0\cdot b_1^n.
$$
По этой причине решение вида $c\cdot b_1^n$ называется \emph{общим решением} уравнения (\ref{eq:lin_rec_1}).

\myitem Подведем предварительные итоги. Так как исходное уравнение (\ref{eq:lin_rec_1}) было очень простым, то нам удалось сразу построить его решение и выяснить, что оно степенным образом зависит от параметра $n$. Затем мы заметили, что если бы нам кто-то заранее подсказал степенной характер решения уравнения (\ref{eq:lin_rec_1}), то нам хватило бы этой информации для построения как общего, так и частного решения нашего рекуррентного уравнения. 

Возникает вопрос: зачем же нам нужен для столь простого уравнения столь сложный алгоритм построения его решения? Оказывается, что этот алгоритм практически без изменений работает и для построения решения линейного однородного уравнения произвольного порядка.  

\mysubitem Рассмотрим в качестве примера линейное однородное рекуррентное соотношение второго порядка
\begin{equation}
\label{eq:lin_rec_2}
a_{n+2}=b_1\cdot a_{n+1}+b_2\cdot a_n,\qquad n=0,1,2,\ldots, \qquad \text{$a_0$, $a_1$ --- заданные числа},
\end{equation}
и попытаемся применить к этому уравнению алгоритм, описанный в конце предыдущего пункта.

Для этого предположим, что частное решение уравнения (\ref{eq:lin_rec_2}) по прежнему степенным образом зависит от параметра $n$, то есть предположим, что существуют такие значения параметров $a_0$ и $a_1$, при которых $a_n=r^n$. Подставляя это выражение в рекуррентное соотношение, получим
$$
r^{n+2}=b_1\cdot r^{n+1}+b_2\cdot r^n\qquad \Longrightarrow\qquad r^2-b_1\,r-b_2=0,
$$
т.е. квадратное уравнение на $r$. Любое его решение $r_0$ дает нам некоторое частное решение уравнения (\ref{eq:lin_rec_2}). По этой причине данное уравнение называется \emph{характеристическим уравнением} для рекуррентного соотношения (\ref{eq:lin_rec_2}).

\mysubitem Предположим, что характеристическое уравнение имеет два различных вещественных корня $r_1$ и $r_2$. Покажем, что в таком случае выражение
\begin{equation}
\label{eq:tot_des_lin_rec_2}
a_n=c_1\,r_1^n+c_2\,r_2^n,
\end{equation}
где $c_1$ и $c_2$ --- произвольные постоянные, является \emph{общим решением} соотношения (\ref{eq:lin_rec_2}) в том смысле, что любое решение (\ref{eq:lin_rec_2}) с заданными начальными условиями в нем содержится.

Действительно, покажем вначале, что выражение (\ref{eq:tot_des_lin_rec_2}) действительно удовлетворяет рекуррентному соотношению (\ref{eq:lin_rec_2}):
$$
c_1\,r_1^{n+2}+c_2\,r_2^{n+2}=b_1\,c_1\,r_1^{n+1}+b_1\,c_2\,r_2^{n+1}+
b_2\,c_1\,r_1^{n}+b_2\,c_2\,r_2^{n}=
$$
$$
=c_1\,(r_1^2-b_1\,r_1-b_2)+c_2\,(r_1^2-b_1\,r_1-b_2)\equiv 0.
$$

Покажем теперь, что это --- действительно общее решение, т.е. что мы всегда можем подобрать константы $c_1$ и $c_2$ так, чтобы решение вида (\ref{eq:tot_des_lin_rec_2}) удовлетворяло любым заданным начальным условиям. Для этого рассмотрим это выражение при $n=0$ и $n=1$:
$$
\begin{aligned}
a_0&=c_1\,r_1^0+c_2\,r_2^0=c_1+c_2,\\
a_1&=c_1\,r_1^1+c_2\,r_2^1=c_1\,r_1+c_2\,r_2.
\end{aligned}
$$
Эти выражения следует рассматривать как систему линейных уравнений для определения неизвестных постоянных $c_1$ и $c_2$. Определитель этой системы
$$
\begin{vmatrix}
1&1\\
r_1&r_2
\end{vmatrix}=r_2-r_1\neq 0,
$$
поэтому система всегда имеет единственное решение.

\mysubitem Пожалуй, самым известным и важным примером рекуррентного соотношения (\ref{eq:lin_rec_2})
является соотношение вида
$$
F_{n+2}=F_{n+1}+F_n,\qquad n=0,1,2,\ldots, \qquad F_0=0,\,\,\,F_1=1,
$$
определяющее так называемые числа Фибоначчи $F_n$. Характеристическое уравнение для этого рекуррентного уравнения имеет вид
$$
r^2=r+1\qquad \Longrightarrow\qquad r_{1,2}=\dfrac{1\pm \sqrt{5}}{2}\qquad \Longrightarrow \qquad
F_n=c_1\,\left(\dfrac{1+ \sqrt{5}}{2}\right)^n+c_2\,\,\left(\dfrac{1-\sqrt{5}}{2}\right)^n.
$$
Константы $c_1$ и $c_2$ определим из начальных условий:
$$
\begin{aligned}
F_0&=0=c_1+c_2\\
F_1&=1=c_1\,\dfrac{1+\sqrt{5}}{2}+c_2\,\dfrac{1-\sqrt{5}}{2}=c_1\,\left[\dfrac{1+\sqrt{5}-1+\sqrt{5}}{2}
\right]=c_1\,\sqrt{5}
\end{aligned}\qquad \Longrightarrow
$$
$$
\Longrightarrow \qquad c_1=+\dfrac{1}{\sqrt{5}},\qquad c_2=-\dfrac{1}{\sqrt{5}}.
$$
Таким образом, окончательно получаем следующее явное выражение для чисел Фибоначчи:
\begin{equation}
\label{eq:exact_Fibb}
F_n=\dfrac{1}{\sqrt{5}}\left(\dfrac{1+ \sqrt{5}}{2}\right)^n-
\dfrac{1}{\sqrt{5}}\left(\dfrac{1- \sqrt{5}}{2}\right)^n.
\end{equation}



\myitem В принципе, описанный выше способ решения рекуррентных соотношений можно пытаться распространять и на соотношения более высокого порядка, и на неоднородные линейные рекуррентные соотношения. Вместо этого, однако, мы в одном из следующих параграфов продемонстрируем более универсальный и удобный способ решения таких соотношений, использующий аппарат производящих функций.


\section*{Упражнения}

\begin{exerc} 
Показать, что в случае равных корней $r_1=r_2=:\rho$ характеристического уравнения общее решение уравнения (\ref{eq:lin_rec_2}) имеет вид
$$
a_n=c_1\,\rho^n+c_2\,n\,\rho^n,
$$
а в случае комплексных корней это решение записывается в виде
$$
a_n=c_1\,\rho^n\cos(n\,\vartheta)+c_2\,\rho^n\sin(n\,\vartheta),
$$
где $\rho$ и $\vartheta$ --- модуль и аргумент одного из двух комплексных корней характеристического уравнения.
\end{exerc}

\begin{exerc} 
Найти общее решение следующих линейных однородных рекуррентных соотношений второго порядка:
$$
a_{n+2}=7a_{n+1}-12a_n;\qquad a_{n+2}=4a_{n+1}-13a_n;\qquad a_{n+2}=-4a_{n+1}-4a_n.
$$
\end{exerc}

\begin{exerc} 
Мы положили тысячу рублей в банк под пять процентов годовых. В начале каждого года мы докладываем пятьсот рублей на счет. Сколько денег будет на счете через $n$ лет?
\end{exerc}

\begin{exerc} В теннисном турнире участвуют $2n$ игроков. Составить и решить рекуррентное соотношение для количества $a_n$ различных пар, которые можно сформировать для $n$ матчей первого круга.
\end{exerc}

\begin{exerc} На плоскости нарисованы $n$ окружностей так, что любая пара окружностей пересекается ровно по двум точкам, и никакие три окружности не имеют общей точки пересечения. Определить количество $a_n$ областей, на которые разбивается плоскость такими окружностями. 
\end{exerc}

\begin{exerc} Рассмотрим плоскость $(x,y)$. Предположим, что мы можем ходить по плоскости, делая шаг вверх $(U)$, шаг вправо $(R)$ и шаг влево $(L)$ на единицу длины так, чтобы шаг $R$ никогда не следовал за шагом $L$ и наоборот. Подсчитать количество $a_n$ таких путей после $n$ шагов.
\end{exerc}

\begin{exerc} \label{ex:space_zond}
Космический зонд обнаружил, что органическое вещество на Марсе имеет ДНК, состоящее из пяти символов $(a,b,c,d,e)$. Четыре пары символов --- $ce$, $cd$, $ed$, $ee$ --- никогда не встречаются в марсианских ДНК, однако любая цепочка, не содержащая этих пар, возможна. Порядок букв в цепочке важен, поэтому, например, цепочка $bbdca$ возможна, а $bbcda$ --- нет. Найти рекуррентные соотношения, которым удовлетворяют эти цепочки слов. Построить решения этих рекуррентных соотношений.
\end{exerc}

\begin{exerc}
Доказать, что числа Фибоначчи $F_n$ удовлетворяют следующим соотношениям:
\begin{equation}
\label{ex:Fib_1}
F_{n+m}=F_{n-1}\, F_m+F_n\, F_{m+1};
\end{equation}
\begin{equation}
\label{ex:Fib_2}
F_1+F_3+\ldots +F_{2n-1}=F_{2n};
\end{equation}
\begin{equation}
\label{ex:Fib_3}
F_1^2+F_2^2+\ldots+ F_n^2=F_n\, F_{n+1}.
\end{equation}
\end{exerc}

\begin{exerc}
Доказать, что любые два последовательно идущих друг за другом числа Фибоначчи $F_n$ и $F_{n+1}$ взаимно простые. 
\end{exerc}

\begin{exerc}
Используя соотношение (\ref{ex:Fib_1}), доказать, что наибольший общий делитель чисел Фибоначчи $F_n$ и $F_m$ есть число Фибоначчи $F_d$, где $d$ есть наибольший общий делитель чисел $n$ и $m$:
$$
\gcd(F_n,F_m)=F_d,\qquad d=\gcd(n,m).
$$
\end{exerc}

\begin{exerc}
Доказать, что возможна, вообще говоря, фибоначчиева система исчисления, показав, что любое натуральное число $N$ можно единственным образом представить в виде суммы
$$
N=a_2F_2+\ldots+a_nF_n,
$$
в которой коэффициенты $a_i$ равны $0$ или $1$, а кроме того, никакие два идущих подряд элемента последовательности чисел $\{a_i\}$ не равны одновременно единице. 
\end{exerc}




\section*{Решение упражнений}

\begin{sol_exerc}
Рассмотрим вначале случай равных корней характеристического уравнения. Подставив в уравнение  (\ref{eq:lin_rec_2}) выражение $a_n=c_1\,\rho^{n}+n\,c_2\,\rho^{n}$, получим
$$
c_1\,\rho^{n+2}+(n+2)\,c_2\,\rho^{n+2}=b_1\,c_1\,\rho^{n+1}+(n+1)\,b_1\,c_2\,\rho^{n+1}+
b_2\,c_1\,\rho^{n}+n\,b_2\,c_2\,\rho^{n}.
$$
Поделим обе части на $\rho^n$ и перенесём всё в левую часть:
$$
c_1\,(\rho^2-b_1\,\rho-b_2)+n\,c_2\,(\rho^2-b_1\,\rho-b_2)  + c_2r\,(2\,\rho-b_1)\equiv 0.
$$
Первые два слагаемых в левой части этого уравнения равны нулю в силу характеристического уравнения. Для того, чтобы понять, что равно нулю и последнее слагаемое, заметим, что в случае совпадающих корней $r_1=r_2=\rho$ имеем
$$
r^2-b_1\,r-b_2=(r-\rho)^2=r-2\rho r+\rho^2 \qquad \Longrightarrow \qquad \rho=b_1/2,
$$
так что из равенства 
$$
r^2-b_1\,r-b_2=0
$$
следует равенство $r-\rho=r-b_1/2=0$. 

Осталось показать, что такой вид решения может удовлетворить любым начальным условиям. Подставив начальные условия в выражение для $a_n$, получим следующую систему двух линейных алгебраических уравнений относительно параметров $c_1$ и $c_2$:
$$
c_1=a_0,
$$
$$
\rho\,(c_1+c_2)=a_1.
$$
Понятно, что такая система имеет решение при любых $a_0$, $a_1$ и $\rho \neq 0$.


Перейдём к случаю двух комплексно сопряжённых корней характеристического уравнения
$$
r_1=x+iy=\rho \,e^{i\, \vartheta},\qquad r_2=x-iy=\rho \,e^{-i\, \vartheta},\qquad \rho,\vartheta\neq 0.
$$
Рассуждения, аналогичные проведенным для случая двух различных вещественных корней, показывают, что общее решение в данном случае также имеет вид 
$$
a_n=c_1\,r_1^n+c_2\,r_2^n.
$$
При этом, так как определитель системы
\begin{equation}
\label{eq:ic1c2}
\begin{aligned}
a_0&=c_1+c_2,\\
a_1&=c_1\,\rho \,e^{i\, \vartheta}+c_2\,\rho \,e^{-i\, \vartheta} = \rho \, (c_1+c_2) \cos \vartheta +\rho \,(i\,c_1-i\,c_2) \sin \vartheta.
\end{aligned}
\end{equation}
отличен от нуля, то мы с помощью общего решения действительно сможем удовлетворить любым начальным условиям.

Перепишем теперь выражение для $a_n$:
$$
a_n=c_1\,r_1^n+c_2\,r_2^n = c_1\,\rho^n\,e^{i\, \vartheta \, n}+c_2\,\rho^n\,e^{-i\, \vartheta \, n} = 
$$
$$
= (c_1+c_2) \,\rho^n\,\cos(n\,\vartheta) + (i\,c_1-i\,c_2) \,\rho^n\,\sin(n\, \vartheta).
$$
Из (\ref{eq:ic1c2}) следует, что коэффициенты $\tilde{c_1}= c_1+c_2$ и $\tilde{c_2}= (i\,c_1-i\,c_2)$ — вещественные числа. Следовательно, общее решение в данном случае действительно можно записать в виде
$$
a_n=\tilde{c_1}\,\rho^n\, \cos(n\,\vartheta) + \tilde{c_2}\,\rho^n\, \sin(n\, \vartheta).
$$
\end{sol_exerc}

\begin{sol_exerc} 
Для рекуррентного соотношения
$$
a_{n+2}=7a_{n+1}-12a_n
$$
корни характеристического уравнения $r^2-7\,r +12 =0$ вещественны и равны $r_1=3,$ $r_2=4$. Следовательно, общий вид решения такого уравнения имеет вид
$$
a_n = c_1\,3^n+c_2\,4^n.
$$

В случае уравнения
$$
a_{n+2}=4a_{n+1}-13a_n
$$
xарактеристическое уравнение $r^2-4\,r +13 =0$ имеет два комплексно-сопряженных корня $r_1=2+3i$ и $r_2=2-3i$. Используя результаты предыдущего упражнения, общий вид решения можно записать так: 
$$
a_n =(\sqrt{13})^n(c_1\cos(n\arctg(3/2)) + c_2\sin(n\arctg(3/2))).
$$

Наконец, характеристическое уравнение для рекуррентного соотношения
$$
a_{n+2}=-4a_{n+1}-4a_n.
$$
имеет вид $r^2+4\,r +4 =0$. Такое уравнение имеет один корень $r=-2$ кратности $2$. С учетом полученных в предыдущем упражнении результатов мы получаем, что
$$
a_n = c_1\,(-2)^n + c_2\,n\,(-2)^n.
$$
\end{sol_exerc}

\begin{sol_exerc}
Обозначим через $a_n$ сумму денег на счете после $n$ лет. Тогда из условий задачи мы получаем следующее рекуррентное соотношение для чисел $a_n:$ 
$$
a_{n+1}=1.05\,a_n+500,\qquad\qquad a_0=1000.
$$
Данное уравнение является неоднородным. С этим легко справиться, введя новую переменную $\tilde{a}_n = a_n+c$ так, чтобы уравнение на $\tilde{a}_n$ получилось однородным:
$$
\tilde{a}_{n+1}-c=500+1.05\,\tilde{a}_n-1.05\,c \qquad \Longrightarrow \qquad c = 10000.
$$
При таком выборе константы $c$ уравнение на $\tilde{a}_n$ принимает следующий вид:
$$
\tilde{a}_{n+1}=1.05\,\tilde{a}_n\qquad \Longrightarrow \qquad \tilde{a_n}=c_1\,\Bigl(\dfrac{21}{20}\Bigr)^n 
\qquad \Longrightarrow \qquad a_n=11000\,\Bigl(\dfrac{21}{20}\Bigr)^n-10000.
$$
\end{sol_exerc}

\begin{sol_exerc}
Выбрать пару для игрока с номером $2n$ можно $2n-1$ способами. Оставшиеся $2n-2$ игроков также нужно разбить на пары. Из этих соображений получается следующее рекуррентное соотношение на количество $a_{2n}$ различных пар: 
$$
a_{2n}=(2n-1)\,a_{2n-2}\qquad \Longrightarrow \qquad a_{2n}=(2n-1)!!.
$$ 
\end{sol_exerc}

\begin{sol_exerc}
Предположим, что на плоскости уже нарисовано $n$ окружностей. Добавим к этим окружностям еще одну. Она пересечёт уже имеющиеся окружности в $2n$ точках. Эти точки разобьют новую окружность на $2n$ дуг, каждая из которых, в свою очередь, разобьет какую-то из уже имеющихся областей на две. Как следствие, для числа областей $a_n$ справедливо следующее соотношение:
$$
a_{n+1}=a_{n}+2n; \quad a_1 = 2.
$$
Выражая $a_n$ через $a_{n-1}$, ${a_{n-1}}$ через ${a_{n-2}}$ и так далее, получим следующий ответ:  
$$
a_n=2(n-1)+2(n-2)+\dots+6+4+2+2 = n(n-1)+2.
$$
\end{sol_exerc}


\begin{sol_exerc}
Обозначим через $U_n,\,L_n,\,R_n$ количество путей, заканчивающихся на шаг вверх, шаг влево и шаг вправо соответственно. Из условий задачи мы можем записать следующие рекуррентные соотношения для этих чисел:
$$
\begin{aligned}
U_{n+1}&=U_n+L_n+R_n,\\
L_{n+1}&=U_n+L_n,\\
R_{n+1}&=U_n+R_n.
\end{aligned}
$$
Сложим эти рекуррентные соотношения:
$$
U_{n+1}+L_{n+1}+R_{n+1}= 3U_n+2L_n+2R_n=2(U_n+L_n+R_n)+U_n=
$$
$$
= 2(U_n+L_n+R_n)+(U_{n-1}+L_{n-1}+R_{n-1}).
$$
Обозначим через $S_n = U_n+L_n+R_n$ общее количество путей длины $n$. Тогда для чисел $S_n$ из последнего уравнения получается следующее рекуррентное соотношение:
$$
S_{n+1}=2S_n+S_{n-1}, \qquad S_0=1, \qquad S_1=3.
$$
Из характеристического уравнения $r^2-2r-1=0$ получаем общий вид решения:
$$
S_n=c_1(1-\sqrt{2})^n+c_2(1+\sqrt{2})^n.
$$
Из начальных условий следует, что
$$
\quad c_1+c_2=1,\quad c_1+c_2 + \sqrt{2}\,(c_2-c_1)=3\qquad \Longrightarrow\qquad
c_1=\dfrac{1-\sqrt{2}}{2},\quad c_2=\dfrac{1+\sqrt{2}}{2}.
$$
Поэтому окончательно
$$
S_n = \dfrac{(1-\sqrt{2})^{n+1}+(1+\sqrt{2})^{n+1}}{2}.
$$
\end{sol_exerc}


\begin{sol_exerc}
Обозначим через $A_n,\,B_n,\,C_n,\,D_n,\,E_n$ количества различных цепочек ДНК, которые заканчиваются на соответствующие буквы. Система рекуррентных соотношений для этих чисел имеет следующий вид:
$$
\begin{aligned}
A_{n+1}&=A_n+B_n+C_n+D_n+E_n,\\
B_{n+1}&=A_n+B_n+C_n+D_n+E_n,\\
C_{n+1}&=A_n+B_n+C_n+D_n+E_n,\\
D_{n+1}&=A_n+B_n+D_n,\\
E_{n+1}&=A_n+B_n+D_n.\\
\end{aligned}
$$
Очевидно, что $A_n=B_n=C_n$, а $D_n=E_n$. Поэтому записанные выше рекуррентные соотношения можно упростить:
$$
\begin{aligned}
A_{n+1}&=3A_n+2D_n,\\
D_{n+1}&=2A_n+D_n.\\
\end{aligned}
$$
Нас интересует значение величины $S_n=3A_n+2D_n$. Для этой величины с учетом полученных выше рекуррентных соотношений на $A_n$ и $D_n$ имеем
$$
S_{n+1}=3A_{n+1}+2D_{n+1}=13A_n+8D_n=4(3A_n+2D_n)+(3A_{n-1}+2D_{n-1})=4S_n+S_{n-1}.
$$
Характеристическое уравнение $r^2-4r-1=0$ для этого рекуррентного соотношения имеет два вещественных корня$r_1=2-\sqrt{5}$ и $r_2=2+\sqrt{5}$. Поэтому с учетом начальных условий $S_0=1,$ $S_1=5$ окончательно получаем следующий ответ:
$$
S_n=\dfrac{ (5-3\sqrt{5})(2-\sqrt{5})^n  + (5+3\sqrt{5})(2+\sqrt{5})^n }{10}.
$$
\end{sol_exerc}


\begin{sol_exerc}
Докажем равенство $F_{n+m}=F_{n-1}\, F_m+F_n\, F_{m+1}$ индукцией по $n+m$. В случае $n+m=1$ это равенство верно. Предположим, что оно верно для любых $k+s<n+m$. Из определения чисел Фибоначчи следует, что 
$$
F_{n+m}=F_{n+m-1}+F_{n+m-2}=(F_{n-1}\, F_{m-1}+F_n\, F_m) + (F_{n-1}\, F_{m-2}+F_n\, F_{m-1})=
$$
$$
=F_{n-1}\,(F_{m-1}+F_{m-2}) + F_{n}\,(F_{m}+F_{m-1})=F_{n-1}\, F_m+F_n\, F_{m+1}.
$$

Второе равенство можно также доказать с использованием определения чисел Фибоначчи, расписывая каждый раз число Фибоначчи с чётным индексом:
$$
F_{2n} = F_{2n-1}+F_{2n-2} = F_{2n-1}+F_{2n-3} + F_{2n-4} = 
$$
$$
= F_{2n-1} + \dots + F_{2n-2k-1}+ F_{2n-2k-2} = F_{2n-1}+\ldots +F_{3} + F_1.
$$

Третье равенство $F_1^2+F_2^2+\ldots+ F_n^2=F_n\, F_{n+1}$ докажем индукцией по $n$. Ясно, что оно верно для $n=1$. Предположим, что оно верно для всех $k<n$. Тогда мы можем записать, что
$$
F_n\, F_{n+1} = F_n^2 + F_n\, F_{n-1}= F_n^2 + \dots + F_2^2 + F_1^2.
$$
\end{sol_exerc}

\begin{sol_exerc}
Пусть $F_{n}$ и $F_{n-1}$ делятся на $k$. Это означает, что их разность, равная $F_{n-2}$, также должна делиться на $k$. Продолжая это рассуждение, получаем, что $F_1$ делится на $k$, что не верно для любых $k \neq 1$.
\end{sol_exerc}

\begin{sol_exerc}
Предположим для определенности, что $m>n$. Тогда мы можем записать следующую цепочку равенств:
$$
\gcd(F_n, F_m) = \gcd(F_n, F_{n+(m-n)}) = \gcd(F_n, F_{n-1}\,F_{m-n}+F_n\,F_{m-n+1}) = \gcd(F_n, F_{n-1}\,F_{m-n}).
$$
Так как числа $F_n$ и $F_{n-1}$ взаимно просты, то
$$
\gcd(F_n, F_{n-1}\,F_{m-n}) = \gcd(F_n, F_{m-n}).
$$
Проодолжая этот процесс до тех пор, пока индексы чисел Фибоначчи (а значит, и сами числа) под знаком $\gcd$ не сравняются, мы получим в итоге, что $\gcd(F_n,F_m)=F_d$ для некоторого $d$. Так как на каждом шаге мы заменяли пару индексов $(n,m)$ на пару $(n,m-n)$, то наибольший общий делитель этих индексов при такой замене не менялся. Следовательно, индекс $d = \gcd(n,m)$, что и требовалось доказать.
\end{sol_exerc}

\begin{sol_exerc}
Докажем это утверждение по индукции. Так как $F_2=1$, то для $N=1$ утверждение верно. Пусть утверждение верно для всех $k<n$. Выберем наибольшее число Фибоначчи $F_m$, не превосходящее $N$. Покажем, что оно входит в разложение числа $N$ с коэффициентом, равным единице. Действительно, 
$$
N = F_m + (N - F_m).
$$
По предположению индукции, второе слагаемое раскладывается в сумму различных чисел Фибонначчи единственным образом, причём никакие два соседних числа Фибоначчи в эту сумму не входят. Числа $F_{m-1}$ и $F_{m}$ в эту сумму также не входят, иначе наибольшим числом Фибоначчи, не превосходящим $N$, было бы не $F_m$, а по меньшей мере $F_{m+1}$. Таким образом, мы получили некоторую запись числа $N$ в фибоначчиевой системе счисления.

Теперь покажем, что полученное разложение единственно. Так как по предположению индукции число $N-F_m$ раскладывается однозначно, то для доказательства единственности достаточно убедиться, что число $F_m$ не может входить в разложение с коэффициентом, отличным от единицы. Мы уже показали, что коэффициент при $F_m$ не может быть больше единицы. Осталось показать, что он не может быть равен нулю. 

Пусть $F_m$ не входит в разложение. Тогда $N = F_{i_1}+F_{i_2} + \dots + F_{i_k}$, где $1 < i_j < m$ для всех $j$, причем все $i_j$ отличаются друг от друга минимум на $2$. Правая часть, таким образом, не превосходит выражения $F_{m-1}+F_{m-3}+\dots + F_p$, где $p\in\{2,3\}$, и ее значение определяется четностью $m$. Такая сумма строго меньше $F_m$, что приводит нас к противоречию, так как $F_m \leq N$.
\end{sol_exerc}




\section{Производящие функции и формальные степенные ряды}

\myitem Понятие производящей функции является, пожалуй, самым важным понятием современной перечислительной комбинаторики. Основная задача данного параграфа состоит в том, чтобы объяснить комбинаторный смысл производящей функции, а также дать по возможности строгое ее определение. 

\mysubitem Пусть вначале $X$ есть некоторое \emph{конечное} множество. Первое, что обычно нам хочется сделать --- это указать мощность этого множества, то есть подсчитать количество всех элементов в нем. Однако, как правило, нам этой информации оказывается недостаточно --- на следующем этапе мы обычно хотим как-то классифицировать элементы этого множества $X$, то есть разбить множество на блоки, объединенные по тому или иному признаку. 

\begin{examp} 
Рассмотрим множество всех товаров на складе. Конечно, может быть кому-то и полезно знать общее количество $N$ единиц хранимых на складе товаров. Однако любой кладовщик вам скажет, что значительно полезнее иметь информацию о количестве единиц товара каждой категории в отдельности --- например, о количестве бутылок вина, коробок с мылом, пакетов с чаем. При таком подходе мы, конечно же, знаем и общее число $N$ товаров --- для его получения нам достаточно сложить количества товаров каждой категории.
\end{examp}

\begin{examp}
Как мы уже знаем, общее количество подмножеств $n$-элементного множества $X$ равно $2^n$. Однако, как правило, нас интересует более подробная информация об этих подмножествах, например, сколько существует подмножеств,  содержащих ровно $k$ элементов. Число таких подмножеств равно, по определению, биномиальному коэффициенту $\BCf{n}{k}$, а суммирование этих коэффициентов по всем $k=0,\ldots,n$ дает нам $2^n$ (формула (\ref{eq:sum_bin_coeff_k})). 
\end{examp}

\mysubitem Рассмотрим теперь \emph{счетное} множество $X$, например, множество всех графов. Здесь вообще ставить вопрос о количестве всех объектов данного множества бессмысленно. Однако и в этом случае задачу перечисления можно сделать вполне содержательной, и сделать это можно с помощью того же подхода. Именно, можно разбить множество $X$ на конечные блоки по тому или иному признаку, и перечислять количество элементов в каждом конкретном блоке.

Например, бессмысленно перечислять все звезды во Вселенной. Однако перечислить все звезды в данной галактике --- вполне разумная задача. Далее, столь же бессмысленно перечислять все графы. Однако перечисление всех различных графов на $n$ вершинах при заданном $n$ есть также вполне содержательная и важная с практической точки зрения задача.

\mysubitem Заметим теперь, что именно этот принцип, а именно, принцип разбиения множества перечисляемых нами элементов на блоки с дальнейшим подсчетом элементов в каждом отдельном блоке, мы и использовали ранее для получения всех основных формул элементарной комбинаторики. Если при этом количество перечисляемых объектов в данном множестве выражалось через количество тех же самых объектов, но в меньших множествах, то мы на выходе получали некоторое рекуррентное соотношение на количество перечисляемых объектов. 

Существует, однако, и еще один очень полезный способ разбиения множества на блоки, который, собственно, и приводит к понятию производящей функции. Именно, припишем всем элементам $x$ рассматриваемого множества $X$ некоторый вес $w(x)$ так, чтобы этот вес совпадал на всех элементах одного и того же блока. Формально сделать это можно с помощью отображения
$$
w\,:\,X\,\longrightarrow\,K
$$
множества $X$ в некоторое коммутативное кольцо $K$, сопоставляющего всем элементам $x$ данного блока $B_k$ одно и то же значение $w(x)=k$, $k\in K$:
$$
B_k=\{x\,\,|\,\,w(x)=k\}, \qquad X=\bigcup\limits_{k\in K}B_k=\bigcup\limits_{k\in K}\{x\,\,|\,\,w(x)=k\}.
$$
Заметим, что при таком подходе всему множеству $X$ в кольце $K$ отвечает вполне конкретный элемент
$$
\sum\limits_{x\in X}w(x)=\sum\limits_{k\in K}c_k\cdot k,\qquad \qquad c_k=|w^{-1}(k)|=\left|B_k\right|,
$$
называемый \emph{энумератором} множества $X$.

\begin{examp} Пусть на складе имеются три пакета с чаем, две бутылки вина и четыре коробки с мылом:
$$
X=\{\mbox{чай}_1,\mbox{чай}_2,\mbox{чай}_3,\mbox{вино}_1,\mbox{вино}_2,\mbox{мыло}_1,
\mbox{мыло}_2,\mbox{мыло}_3,\mbox{мыло}_4\}.
$$
Рассмотрим теперь отображение $w$ этого множества $X$ в коммутативное кольцо $K$ над множеством, содержащим элементы $\{\mbox{ч},\mbox{в},\mbox{м}\}$, задаваемое равенствами
$$
w(\mbox{чай}_i)=\mbox{ч},\qquad w(\mbox{вино}_i)=\mbox{в},\qquad w(\mbox{мыло}_i)=\mbox{м}.
$$
Тогда все множество $X$ разобьется на три блока, а энумератор этого множества примет вид
$$
w(X)=3\mbox{ч}+2\mbox{в}+4\mbox{м}.
$$
\end{examp}

\begin{examp}
Рассмотрим множество $2^X$ всех подмножеств $n$-элементного множества $X$, а также коммутативное кольцо $K$ над множеством, содержащим элементы $x$ и $y$. Сопоставим любому элементу $Y\subset X$ множества $2^X$ вес $w=x^ky^{n-k}$, где $k$ есть мощность подмножества $Y$. Отображение $w:2^X\to K$ разобъет множество $2^X$ на блоки $B_k$ мощности $c_k=\BCf{n}{k}$. При этом самому множеству $2^X$ в кольце $K$ будет соответствовать энумератор вида
\begin{equation}
\label{eq:enum_2_X}
w(2^X)=\sum\limits_{k=0}^n\BCf{n}{k}x^ky^{n-k}=(x+y)^n.
\end{equation}
\end{examp}

\mysubitem Как правило, в перечислительной комбинаторике при построении отображения $w:X\to K$ используют несколько стандартных колец. Именно, рассмотрим множество $\C^{\Z_+}$ всех счетных последовательностей $(a_0,a_1,a_2,\ldots)$ комплексных чисел:
$$
\C^{\Z_+}:=\{(a_0,a_1,a_2,\ldots)\,|\,a_i\in \C\quad \forall \,i\in \Z_+\}.
$$
Введем на этом множестве две базовые операции --- сложения и умножения. Операция сложения числовых последовательностей определяется обычно как операция поэлементного сложения:
\begin{equation}
\label{eq:num_seq_add}
(a_0,a_1,a_2,\ldots)+(b_0,b_1,b_2,\ldots)=(a_0+b_0,a_1+b_1,a_2+b_2,\ldots).
\end{equation}
Операцию же умножения
$$
(a_0,a_1,a_2,\ldots)\cdot(b_0,b_1,b_2,\ldots)=(c_0,c_1,c_2,\ldots)
$$
можно вводить по-разному. Чаще всего на практике используются следующие два способа умножения этих последовательностей: свертка
\begin{equation}
\label{eq:num_seq_prod_od}
c_n=\sum\limits_{i=0}^n a_i\cdot b_{n-i}
\end{equation}
и биномиальная свертка
\begin{equation}
\label{eq:num_seq_prod_exp}
c_n=\sum\limits_{i=0}^n \BCf{n}{i}\cdot a_i\cdot b_{n-i}
\end{equation}
числовых последовательностей. В обоих случаях множество $\C^{\Z_+}$ с введенными на нем операциями представляет собой коммутативное кольцо (точнее, коммутативную область целостности).

\mysubitem На практике с такими кольцами удобно работать как с кольцами $\C[[z]]$ и $\C_e[[z]]$ формальных степенных рядов. В таких кольцах для элемента $(0,1,0,0,\ldots)$ вводится специальное обозначение
$$
(0,1,0,0,\ldots)=:z.
$$
Рассмотрим вначале случай кольца $\C[[z]]$ с правилом умножения (\ref{eq:num_seq_prod_od}). Заметим, что
$$
z^2:=z\cdot z=(0,1,0,0,\ldots)\cdot (0,1,0,0,\ldots)=(0\cdot 0,0\cdot 1+1\cdot 0,0\cdot 0+1\cdot 1
+0\cdot 0,\ldots)=(0,0,1,0,\ldots),
$$
$$
z^3:=z\cdot z\cdot z=(0,1,0,0,\ldots)\cdot (0,1,0,0,\ldots)\cdot (0,1,0,0,\ldots)=(0,1,0,0,\ldots)\cdot
(0,0,1,0,\ldots)=
$$
$$
=(0\cdot 0,0\cdot 0+1\cdot 0,0\cdot 1+1\cdot 0 +0\cdot 0,0\cdot 0+1\cdot 1
+0\cdot 0+0\cdot 0,\ldots)=(0,0,0,1,0,\ldots),
$$
В общем случае, как несложно проверить по индукции,
$$
z^n:=\underbrace{z\cdot z\cdot\ldots\cdot z}_{n}=(0,\ldots,0,1,0,\ldots),
$$
где единица в последнем выражении стоит на $n$-й позиции, $n=0,1,\ldots$. Как следствие, любую последовательность чисел $(a_0,a_1,a_2,\ldots)$ можно записать в виде формального степенного ряда
$$
(a_0,a_1,a_2,\ldots)=\sum\limits_{n=0}^{+\infty}a_nz^n=:a(z)\,\in\,\C[[z]].
$$

Аналогично, в случае кольца $\C_e[[z]]$ с правилом умножения (\ref{eq:num_seq_prod_exp}) несложно убедиться в том, что
$$
z^n:=\underbrace{z\cdot z\cdot\ldots\cdot z}_{n}=(0,\ldots,0,n!,0,\ldots),
$$
причем единственное ненулевое число $n!$ стоит в этой последовательности на $n$-м месте. Поэтому в кольце $\C_e[[z]]$ любая последовательность чисел $(a_0,a_1,a_2,\ldots)$ может быть записана так:
$$
(a_0,a_1,a_2,\ldots)=\sum\limits_{n=0}^{+\infty}a_n\dfrac{z^n}{n!}=:A(z)\,\in\,\C_e[[z]].
$$

\mysubitem Вернемся теперь к перечисляемому нами множеству $X$ и рассмотрим отображение
$$
w:X\longrightarrow \C[[z]],
$$
которое любому элементу $x\in X$ сопоставляет некоторый формальный степенной ряд вида
$$
w(x)=0\cdot 1+0\cdot z+\ldots+0\cdot z^{k-1}+1\cdot z^k+0\cdot z^{k+1}+\ldots=z^k.
$$
По сути дела, при таком подходе вес любого элемента $x\in X$ определяется степенью $k\in\Z_+$ особого элемента $z$ кольца $\C[[z]]$. Тогда суммирование образов $w(x)$ этого отображения по всем $x\in X$ даст нам энумератор вида
$$
f(z):=\sum\limits_{x\in X}w(x)=\sum\limits_{n=0}^{+\infty}c_nz^n,
$$
то есть формальный степенной ряд, коэффициенты $c_n$ которого дают нам количество элементов $x\in X$, имеющих заданный вес $z^n=(0,0,\ldots,0,1,0,\ldots)$. Этот энумератор и называют \emph{обыкновенной производящей функцией} множества $X$.

Аналогично, рассматривая отображение
$$
w_e:X\longrightarrow \C_e[[z]],
$$
сопоставляющее любому элементу $x\in X$ формальный степенной ряд вида
$$
w(x)=0\cdot 1+0\cdot \dfrac{z}{1!}+\ldots+0\cdot \dfrac{z^{k-1}}{(k-1)!}+1\cdot
\dfrac{z^k}{k!}+0\cdot \dfrac{z^{k+1}}{(k+1)!}+\ldots=\dfrac{z^k}{k!},
$$
мы получаем в качестве энумератора $X$ формальный степенной ряд
$$
F(z):=\sum\limits_{x\in X}w_e(x)=\sum\limits_{n=0}^{+\infty}c_n\dfrac{z^n}{n!},
$$
называемый \emph{экспоненциальной производящей функцией} множества $X$.

\mysubitem Согласно определению, каждая производящая функция является элементом кольца формальных степенных рядов. Следовательно, любую пару производящих функций можно складывать и перемножать между собой.

Формальные правила сложения и умножения этих функций, естественно, совпадают с описанными выше правилами (\ref{eq:num_seq_add})--(\ref{eq:num_seq_prod_exp}) сложения и умножения отвечающих этим рядам числовых последовательностей. Именно, пусть
$$
f(z)=a_0+a_1z+a_2z^2+\ldots\qquad \text{и} \qquad g(z)=b_0+b_1z+b_2z^2+\ldots
$$
есть пара обыкновенных производящих функций для множеств $X$ и $Y$ соответственно, а
$$
F(z)=a_0+a_1\dfrac{z}{1!}+a_2\dfrac{z^2}{2!}+\ldots\qquad \text{и}
\qquad G(z)=b_0+b_1\dfrac{z}{1!}+b_2\dfrac{z^2}{2!}
$$
есть пара экспоненциальных производящих функций для этой пары множеств. Тогда суммой этих производящих функций называются формальные степенные ряды
$$
f(z)+g(z):=(a_0+b_0)+(a_1+b_1)z+(a_2+b_2)z^2+\ldots
$$
и
$$
F(z)+G(z):=(a_0+b_0)+(a_1+b_1)\dfrac{z}{1!}+(a_2+b_2)\dfrac{z^2}{2!}+\ldots
$$
Произведением производящих функций называются формальные степенные ряды
$$
h(z)=f(z)\cdot g(z):=c_0+c_1z+c_2z^2+\ldots\qquad \text{и}
\qquad H(z)=F(z)\cdot G(z):=c_0+c_1\dfrac{z}{1!}+c_2\dfrac{z^2}{2!}+\ldots,
$$
коэффициенты $c_n$ которых вычисляются по формулам (\ref{eq:num_seq_prod_od}) и (\ref{eq:num_seq_prod_exp}) соответственно.

Важно, что сложение и умножение любых двух производящих функций имеет и вполне определенный комбинаторный смысл. Выяснение этого смысла мы отложим до одного из следующих параграфов. Сейчас же, на время забыв о перечисляемом множестве $X$, займемся изучением свойств производящих функций с точки зрения теории формальных степенных рядов.


\myitem Итак, по определению, обыкновенная и экспоненциальная производящие функции являются элементами формальных степенных рядов $\C[[z]]$ и $\C_e[[z]]$. Поговорим немного подробнее о таких формальных степенных рядах.

\mysubitem Прежде всего, подчеркнем отличие формальных степенных рядов от рядов, встречающихся в математическом анализе. По сути дела, любой формальный степенной ряд --- это некоторая картинка, удобная для изображения заданной числовой последовательности $(a_0,a_1,a_2,\ldots)$. Например, рассмотрим формальный степенной ряд
\begin{equation}
\label{eq:factorial_series}
f(z)=\sum\limits_{n=0}^{+\infty}n!\,z^n=1+z+2z^2+6z^3+24z^4+\ldots,
\end{equation}
отвечающий числовой последовательности $(1,1,2,6,24,\ldots)$. Символы $1,z,z^2,z^3,\ldots$ в такой форме записи играют, по сути, роль индексов --- они нужны лишь для того, чтобы указывать позиции, на которых стоят элементы этой числовой последовательности. Например, если коэффициент при $z^4$ равен $24$, то это означает лишь, что число $24$ есть четвертый элемент рассматриваемой числовой последовательности.

Как следствие, в теории формальных степенных рядов символ $z$ не надо рассматривать как комплексную переменную, которая может принимать какие-то конкретные значения. Нет смысла вычислять значения таких рядов как предел последовательности частичных сумм ни при каких конкретных значениях $z$. Наконец, в этой теории можно обойтись без понятия сходящихся или расходящихся рядов.

Так, например, с точки зрения математического анализа рассматривать ряд (\ref{eq:factorial_series}) смысла не имеет --- он расходится при всех значениях $z>0$. В комбинаторике же этот ряд, понимаемый как обыкновенная производящая функция, имеет вполне конкрентый и весьма важный комбинаторный смысл: коэффициенты этого ряда задают количество всех перестановок заданного $n$-элементного множества.

\mysubitem Несмотря на все вышесказанное, опыт, накопленный при работе с рядами из математического анализа, часто бывает полезен и при анализе формальных степенных рядов. Связано это, прежде всего, с тем, что многие базовые операции над рядами, такие, как сложение или умножение, вводятся одинаково как для обычных, так и для формальных степенных рядов.

\begin{examp} \label{examp:prod_form_ser}
Перемножим два формальных степенных ряда из $\C[[z]]$:
$$
f(z)=\sum\limits_{n=0}^{+\infty}\alpha^nz^n\qquad \text{и} \qquad g(z)=1-\alpha z.
$$
Коэффициент $c_0$ в произведении $h(z)=f(z)\cdot g(z)$, очевидно, равен $\alpha^0\cdot 1=1$. Несложно убедиться, что остальные коэффициенты $c_k$ равны нулю:
$$
c_k=\alpha^k\cdot 1-\alpha\cdot \alpha^{k-1}\equiv 0.
$$
Следовательно,
$$
f(z)\cdot g(z)=
\Bigl(\sum\limits_{n=0}^{+\infty}\alpha^nz^n\Bigr)\cdot (1-\alpha z)=1 \qquad \Longrightarrow\qquad
f(z)=\sum\limits_{n=0}^{+\infty}\alpha^nz^n=g^{-1}(z)=(1-\alpha z)^{-1}=:\dfrac{1}{1-\alpha z}.
$$
Заметим теперь, что формула
\begin{equation}
\label{eq:geom_progr}
1+\alpha z+ \alpha^2z^2+\ldots=\dfrac{1}{1-\alpha z}\qquad \forall \,\alpha\in \C
\end{equation}
есть хорошо известная формула для суммы геометрической прогрессии. В математическом анализе смысл этой формулы состоит в следующем: ряд, стоящий в левой ее части, сходится к функции, стоящей в ее правой части, при всех $z$, таких, что $|\alpha z|<1$. В теории формальных степенных рядов ее смысл другой: формула означает, что функции $f(z)$ и $g(z)$ являются взаимно-обратными по отношению к операции умножения в кольце $\C[[z]]$ формальных степенных рядов. Однако, несмотря на смысловые отличия, вид самого тождества и в том, и в другом случае одинаков.
\end{examp}

\mysubitem Сформулированное выше наблюдение можно использовать для получения различных соотношений, связывающих элементы кольца формальных степенных рядов. Именно, пусть у нас имеются две функции $f(z)$ и $g(z)$ комплексного аргумента, аналитические в некоторой общей для них окрестности точки $z=0$. Предположим, что в этой окрестности функции удовлетворяют какому-то общему для них соотношению. Представим эти функции в форме сходящихся степенных рядов. Тогда высока вероятность того, что указанное выше соотношение будет справедливым и как некоторое соотношение между формальными степенными рядами, то есть как некоторое соотношение, справедливое для некоторых двух элементов кольца формальных степенных рядов. 

С этой точки зрения доказанное в примере  \ref{examp:prod_form_ser} тождество (\ref{eq:geom_progr}) может быть получено так. Рассмотрим функции комплексного аргумента
$$
f(z)=\dfrac{1}{1-\alpha z}\qquad \text{и} \qquad g(z)=1-\alpha z,
$$
аналитические в области $|\alpha z|<1$. Последнее, в частности, означает, что эти функции в области $|\alpha z|<1$ единственным образом представляются своими рядами Тейлора
$$
f(z)=1+\alpha z+\alpha^2z^2+\ldots \qquad  \text{и} \qquad g(z)=1-\alpha z+0 z^2+\ldots.
$$
Кроме того, в этой области для них справедливо очевидное равенство $f(z)\cdot g(z)=1$, которое в терминах соответствующих им рядов записывается так:
\begin{equation}
\label{eq:geom_progr_1}
f(z)\cdot g(z)=1\qquad \Longleftrightarrow \qquad
\Bigl(\sum\limits_{n=0}^{+\infty}\alpha^nz^n\Bigr)\cdot (1-\alpha z)=1.
\end{equation}
Все, что теперь остается проверить --- это то, что данное равенство останется справедливым, если его рассматривать и как некоторое тождество между формальными степенными рядами в $\C[[z]]$.

Рассмотрим еще несколько примеров из этой же серии.

\begin{examp} Рассмотрим функции $F(z)=\exp(z)$ и $G(z)=\exp(-z)$, аналитические на всей комплексной плоскости. Очевидное равенство $F(z)\cdot G(z)=1$ в терминах соответствующих им рядов Тейлора выглядит так:
$$
\exp(z)\cdot\exp(-z)=1\qquad \Longleftrightarrow \qquad
\Bigl(\sum\limits_{n=0}^{+\infty}1\cdot \dfrac{z^n}{n!}\Bigr)\cdot
\Bigl(\sum\limits_{n=0}^{+\infty}(-1)\cdot \dfrac{z^n}{n!}\Bigr)=1.
$$
Несложно убедиться, что это равенство оказывается справедливым и как соотношение между двумя элементами кольца $\C_e[[z]]$. Применяя теперь правило (\ref{eq:num_seq_prod_exp}) умножения в кольце $\C_e[[z]]$, получаем хорошо
известное и очень полезное тождество для биномиальных коэффициентов
$$
\sum\limits_{k=0}^{n}(-1)^k\BCf{n}{k}=
\begin{cases}
0,& \text{если $n>0$,}\\
1,& \text{если $n=0$.}
\end{cases}
$$
\end{examp}


\begin{examp} Пусть $F(z)$, $G(z)$ -- пара аналитических функций, связанных в некоторой общей для них окрестности точки $z=0$ тождеством вида
$$
F(z)=G(z)\cdot e^z.
$$
Очевидно, что тогда
$$
G(z)=F(z)\cdot e^{-z}.
$$
На языке формальных степенных рядов $F(z),G(z)\in\C_e[[z]]$ эти равенства отвечают формулам обращения
$$
f_n=\sum\limits_{k=0}^n\BCf{n}{k}\,g_k\qquad \Longleftrightarrow \qquad
g_n=\sum\limits_{k=0}^n(-1)^{n-k}\BCf{n}{k}\,f_k.
$$
\end{examp}

\begin{rem}
Подводя итоги, можно сказать, что описанный выше способ есть хороший способ \emph{получения} разного рода соотношений между формальными степенными рядами. При этом, вообще говоря, это не есть способ их \emph{доказательства} --- по идее, мы обязательно должны затем проверить справедливость любого такого тождества, используя только лишь определение операций над формальными степенными рядами в соответствующем кольце формальных степенных рядов. Однако в случае, когда в полученных соотношениях фигурируют только лишь операции сложения и умножения, мы можем сразу сказать, что эти соотношения верны и как соотношения между формальными степенными рядами. Действительно, справедливость таких соотношений сразу следует из того факта, что операции сложения и умножения определены одинаково как в математическом анализе, так и в теории формальных степенных рядов.
\end{rem}



\myitem Как уже неоднократно отмечалось, формула (\ref{eq:geom_progr_1}) указывает на то, что функции $f(z)$ и $g(z)$ являются взаимно-обратными по отношению к операции умножения в кольце формальных степенных рядов $\C[[z]]$. Возникает вопрос: какими свойствами должна обладать функция $g(z)\in\C[[z]]$ для того, чтобы она имела обратный по отношению к операции умножения элемент в кольце формальных степенных рядов $\C[[z]]$? Оказывается, необходимым и достаточным условием для этого является отличие коэффициента $b_0$ при $z^0=1$ от нуля.

\mysubitem Действительно, пусть $g(z)=b_0+b_1z+b_2z^2+\ldots$ и коэффициент $b_0\neq 0$. Покажем, что в этом случае обязательно существует функция $f(z)=a_0+a_1z+a_2z^2+\ldots$, такая, что $f(z)\cdot g(z)=1$.

Для этого перемножим два формальных степенных ряда $f(z)$ и $g(z)$, а затем приравняем в равенстве $f(z)\cdot g(z)=1$ коэффициенты при одинаковых степенях $z$:
$$
\begin{aligned}
z^0:&\qquad a_0\cdot b_0=1&\qquad \Longrightarrow \qquad &a_0=\dfrac{1}{b_0}\neq 0;\\
z^1:&\qquad a_0\cdot b_1+a_1\cdot b_0=0&\qquad \Longrightarrow \qquad&
a_1=-\dfrac{1}{b_0}\cdot (a_0\,b_1);\\
z^2:&\qquad a_0\cdot b_2+a_1\cdot b_1+a_2\cdot b_0=0&\qquad \Longrightarrow \qquad&
a_2=-\dfrac{1}{b_0}\cdot (a_0\,b_2+a_1\,b_1);\\
&&\cdots&
\end{aligned}
$$
Видно, что таким образом шаг за шагом можно восстановить все коэффициенты $a_n$ формального степенного ряда $f(z)$.

Обратно, пусть $f(z)=a_0+a_1z+a_2z^2+\ldots$ и $g(z)=b_0+b_1z+b_2z^2+\ldots$ --- обыкновенные производящие функции, такие, что $f(z)\cdot g(z)=1$. Тогда, согласно формуле умножения обыкновенных производящих функций, $a_0\cdot b_0=1$. Отсюда, в частности, следует, что $b_0\neq 0$.

\mysubitem Пусть теперь $h(z)=c_0+c_1z+c_2z^2+\ldots$ и $g(z)=b_0+b_1z+b_2z^2+\ldots$ --- два произвольных элемента кольца $\C[[z]]$, причем $b_0\neq 0$. Пусть для определенности $b_0=1$. В этом случае можно рассматривать формальные дроби вида $h(z)/g(z)$ как элементы $f(z)\in\C[[z]]$, такие, что $f(z)\cdot g(z)=h(z)$. Говорят, что все эти элементы $f(z)$ образуют \emph{поле частных} кольца $\C[[z]]$. По сути же дела, их можно рассматривать как результат \emph{деления} формального степенного ряда $h(z)$ на формальный степенной ряд $g(z)$. Так, в рассмотренном в примере  \ref{examp:prod_form_ser} ряд
$$
f(z)=1+\alpha z+ \alpha^2z^2+\ldots
$$
можно рассматривать как результат деления формальных степенных рядов $h(z)=1$ и $g(z)=1-\alpha z$.

\mysubitem В качестве еще одного чрезвычайно полезного для дальнейшего изложения примера приведем следующее обобщение формулы (\ref{eq:geom_progr}):
\begin{equation}
\label{eq:geom_progr_tot_k}
\dfrac{1}{(1-\alpha z)^k}=\sum\limits_{n=0}^{+\infty}\BCCf{k}{n}(\alpha\,z)^n.
\end{equation}
Для проверки этой формулы следует, вообще говоря, показать, что умножение стоящего в правой части равенства (\ref{eq:geom_progr_tot_k}) ряда $f(z)$ на ряд $g(z)=(1-\alpha z)^k$ дает единицу для любого $k\in\N$. Однако проще всего доказать эту формулу, воспользовавшись отмеченной выше связью между формальными степенными рядами и аналитическими функциями комплексного аргумента.

Действительно, рассмотрим пару функций
$$
f(z)=\dfrac{1}{(1-\alpha z)^k} \qquad \text{и} \qquad g(z)=(1-\alpha z)^k
$$
комплексного аргумента $z$, аналитических в общей для них области $|\alpha z|<1$. Ясно, что в этой области справедливо равенство
$$
f(z)\cdot g(z)=1.
$$
Все, что теперь осталось для доказательства тождества  (\ref{eq:geom_progr_tot_k}) --- это разложить функцию $f(z)$ в ряд Тейлора в области $|\alpha z|<1$.

Для этого вспомним хорошо известную из курса математического анализа формулу бинома Ньютона 
\begin{equation}
\label{eq:Bin_Newt_tot}
(1+z)^q=\sum\limits_{n=0}^{+\infty}\dfrac{(q)_n}{n!}z^n=1+
\sum\limits_{n=1}^{+\infty}\dfrac{q\,(q-1)\,\ldots\,(q-n+1)}{n\,(n-1)\,\ldots\,1}z^n,
\end{equation}
справедливую для любого $q\in \C$ и $|z|<1$. Полагая в (\ref{eq:Bin_Newt_tot}) в качестве $q=-k$, $k\in\N$, и заменяя в ней $z$ на $\alpha z$, получаем следующую цепочку равенств, приводящую к формуле (\ref{eq:geom_progr_tot_k}):
$$
\dfrac{1}{(1-\alpha z)^k}=(1-\alpha z)^{-k}=\sum\limits_{n=0}^{+\infty}\dfrac{(-k)_n}{n!}(-\alpha\,z)^n=
$$
$$
=1+\sum\limits_{n=1}^{+\infty}\dfrac{(-k)\,(-k-1)\,\ldots\,(-k-(n-1))}{n\,(n-1)\,\ldots\,1}(-1)^n
(\alpha\,z)^n=
$$
$$
=\sum\limits_{n=0}^{+\infty}\BCf{k+n-1}{n}(\alpha\,z)^n=
\sum\limits_{n=0}^{+\infty}\BCCf{k}{n}(\alpha\,z)^n.
$$

В частном случае $k=2$ и $k=3$ из (\ref{eq:geom_progr_tot_k}) имеем следующие полезные формулы:
\begin{equation}
\label{eq:geom_progr_tot_2}
\dfrac{1}{(1-\alpha z)^2}=1+2\,\alpha\,z+3\,\alpha^2 z^2+4\,\alpha^3 z^3+\ldots+(n+1)\alpha^n z^n+\ldots,
\end{equation}
\begin{equation}
\label{eq:geom_progr_tot_3}
\dfrac{1}{(1-\alpha z)^3}=1+3\,\alpha\,z+6\,\alpha^2 z^2+10\,\alpha^3 z^3+\ldots+
\dfrac{(n+1)(n+2)}{2}\alpha^n z^n+\ldots.
\end{equation}

\mysubitem В заключение заметим, что все рассуждения, связанные с делением формальных степенных рядов из кольца $\C[[z]]$, легко переносятся и на элементы кольца $\C_e[[z]]$. В частности, формальный степенной ряд $G(z)=b_0+b_1z/1!+b_2z^2/2!+\ldots$ имеет обратный по отношению к операции умножения в $\C_e[[z]]$, если $b_0\neq 0$.


\myitem В параграфе, посвященном биномиальным коэффициентам, мы уже видели, как можно эффективно использовать энумератор (\ref{eq:enum_2_X}) для получения разного рода соотношений между биномиальными коэффициентами. В следующем параграфе мы продемонстрируем эффективность использования формальных степенных рядов при решении рекуррентных соотношений. 


\section*{Упражнения}

\begin{exerc}
Как уже отмечалось выше, существует достаточно большое количество различных правил умножения числовых последовательностей, из которых (\ref{eq:num_seq_prod_od}) и (\ref{eq:num_seq_prod_exp}) лишь самые популярные. Так, например, в комбинаторных задачах, связанных с циклическими последовательностями, часто используется еще одно правило умножения --- так называемая свертка Дирихле. Именно, пусть 
$$
(a_1,a_2,\ldots)\qquad \text{и} \qquad (b_1,b_2,\ldots)
$$
есть пара числовых последовательностей. Их сверткой Дирихле называется числовая последовательность $(c_1,c_2,\ldots)$, коэффициенты $c_n$ которой рассчитываются по формулам
\begin{equation}
\label{eq:num_seq_prod_Dir}
c_n=\sum\limits_{d\backslash n}a_db_{n/d}.
\end{equation}
Суммирование в этой формуле происходит по всем делителям $d$ целого положительного числа $n$, то есть по всем таким положительным числам $d$, для которых существует $k\in\Z$, такое, что выполняется равенство $n=k\cdot d$. Множество $\C^{\N}$ числовых последовательностей $(a_1,a_2,\ldots)$ с введенными на нем операциями сложения (\ref{eq:num_seq_add}) и умножения (\ref{eq:num_seq_prod_Dir}) образует коммутативное кольцо.
 
\begin{exerc_text}
Поставим в соответствие числовой последовательности $(a_1,a_2,\ldots)$ формальный степенной ряд вида
\begin{equation}
\label{eq:Dirichle_series}
f(z)=\dfrac{a_1}{1^z}+\dfrac{a_2}{2^z}+\dfrac{a_3}{3^z}+\ldots=\sum\limits_{n=1}^{+\infty}\dfrac{a_n}{n^z},
\end{equation}
называемый \emph{рядом Дирихле} числовой последовательности $(a_1,a_2,\ldots)$. С точки зрения математического анализа этот ряд в области $\Re z>\sigma$ задает некоторую аналитическую функцию $f(z)$ комплексного аргумента $z\in\C$. Покажите, что коэффициенты $c_n$ у получающейся в результате перемножения двух таких функций 
$$
f(z)=\dfrac{a_1}{1^z}+\dfrac{a_2}{2^z}+\dfrac{a_3}{3^z}+\ldots\qquad \text{и}\qquad 
g(z)=\dfrac{b_1}{1^z}+\dfrac{b_2}{2^z}+\dfrac{b_3}{3^z}+\ldots
$$
функции $h(z)=\sum\limits_{n=1}^{+\infty}\dfrac{c_n}{n^z}$ рассчитываются по формулам (\ref{eq:num_seq_prod_Dir}).
\end{exerc_text}

Как следствие, ряд вида (\ref{eq:Dirichle_series}) можно рассматривать как элемент кольца $\C_d[[z]]$ формальных степенный рядов, операции сложения и умножения в котором определяются формулами (\ref{eq:num_seq_add}) и (\ref{eq:num_seq_prod_Dir}) соответственно. Нейтральным элементом по умножению в этом кольце является функция $I(z)=1/1^z=1$, отвечающая числовой последовательности
\begin{equation*}
I_n=\begin{cases}
1,&\text{если $n=1$},\\
0,&\text{если $n>1$},
\end{cases}
\end{equation*}
а любой элемент кольца $f(z)\in\C_d[[z]]$ с ненулевым свободным членом $a_1\neq 0$ обратим по умножению.
\end{exerc}

\begin{exerc} 
Числовой последовательности $(1,1,1,\ldots)$ в кольце $\C_d[[z]]$ отвечает формальный степенной ряд вида
$$
\zeta(z)=\dfrac{1}{1^z}+\dfrac{1}{2^z}+\dfrac{1}{3^z}+\ldots,
$$
известный как \emph{$\zeta$-функция Римана}. Ее аналогами в кольцах $\C[[z]]$ и $\C_e[[z]]$ являются функции $f(z)=1/(1-z)$  и $F(z)=e^z$ соответственно. 

\begin{exerc_text}
Пусть $\delta_n$ есть количество делителей $d$ числа $n$. Обозначим через $\delta(z)$ функцию Дирихле, отвечающую этой числовой последовательности $(\delta_1,\delta_2,\ldots).$ Выразите $\delta(z)$ через $\zeta$-функцию Римана.
\end{exerc_text}


\begin{exerc_text} Функцией Мебиуса $\mu(z)$ называется функция, обратная к $\zeta$-функции по отношению к операции умножения в кольце формальных степенных рядов $\C_d[[z]]$. Это означает, что
$$
\mu(z)\cdot \zeta(z)=\zeta(z)\cdot \mu(z)=I(z)\qquad \Longleftrightarrow \qquad 
\sum\limits_{d\backslash n}\mu_d=\begin{cases}
1,&\text{если $n=1$},\\
0,&\text{если $n>1$}.
\end{cases}
$$
Покажите, что коэффициенты $\mu_n$ этой функции можно вычислить с использованием следующей явной формулы:
\begin{equation*}
\mu_n=\begin{cases}
1,&\,\,\,\text{если $n=1$,}\\
(-1)^s,&\begin{array}{l}
\text{если в каноническом разложении $n$ на простые множители $n=p_1^{\alpha_1}\ldots p_s^{\alpha_s}$}\\
\text{все показатели $\alpha_i=1$},
\end{array}\\
0,&\,\,\,\text{если в этом разложении существует хотя бы одно $\alpha_i>1$}.
\end{cases}
\end{equation*}
Так, например,
\begin{center}
\begin{tabular}{|c||c|c|c|c|c|c|c|c|c|c|c|}
\hline
$n$&$1$&$2$&$3$&$4$&$5$&$6$&$7$&$8$&$9$&$10$&$11$\\
\hline
$\mu_n$&$1$&$-1$&$-1$&$0$&$-1$&$1$&$-1$&$0$&$0$&$1$&$-1$\\
\hline
\end{tabular}
\end{center}
\end{exerc_text}

\end{exerc}

\begin{exerc}
Из определения функций $\zeta(z)$ и $\mu(z)$ следует, что если функции $f(z),g(z)\in\C_d[[z]]$ связаны равенством
\begin{equation*}
f(z)=\zeta(z)\cdot g(z),\qquad\qquad\text{то}\qquad\qquad g(z)=\mu(z)\cdot f(z).
\end{equation*}
Этим равенствам отвечают следующие \emph{формулы обращения Мебиуса:}
\begin{equation}
\label{eq:obr_Meb}
a_n=\sum\limits_{d\backslash n}b_d\qquad\qquad \Longrightarrow \qquad\qquad 
b_n=\sum\limits_{d\backslash n}\mu_d\, a_{n/d}.
\end{equation}

\begin{exerc_text} Функцией Эйлера $\phi(z)$ называется формальный степенной ряд вида
$$
\phi(z)=\dfrac{\phi_1}{1^z}+\dfrac{\phi_2}{2^z}+\ldots+\dfrac{\phi_n}{n^z}+\ldots,
$$
коэффициенты $\phi_n$ которой подсчитывают количество чисел $0<d<n$, взаимно-простых с $n$. Докажите, что для любого $n\geq 0$ справедливо тождество
$$
n=\sum\limits_{d\backslash n}\phi_d\qquad\qquad \Longleftrightarrow \qquad\qquad \zeta(z-1)=\zeta(z)\cdot \phi(z).
$$
\end{exerc_text}

Из этого равенства и формулы (\ref{eq:obr_Meb}) обращения Мебиуса получается следующее явное выражение для коэффициентов $\phi_n$:
\begin{equation}
\label{eq:fun_Eul_coeff}
\phi(z)=\mu(z)\cdot \zeta(z-1)\qquad\qquad \Longleftrightarrow \qquad\qquad
\phi_n=\sum\limits_{d\backslash n}\mu_d\,\dfrac{n}{d}=n\sum\limits_{d\backslash n}\dfrac{\mu_d}{d}.
\end{equation}

Дополнительные сведения о производящих функциях Дирихле, а также об использовании этих функций в теории чисел можно посмотреть, например, в \cite{Apostol}.
\end{exerc}

\begin{exerc}
Рассмотрим число $N_n(k)$ циклических последовательностей длины $k$ над алфавитом из $n>1$ букв. Если бы все буквы в любой такой последовательности были бы различны, то общее количество этих последовательностей было бы в $k$ раз меньше количества $n^k$ всех строк длины $k$ над $n$-элементным алфавитом. Однако в данной задаче это условие не выполняется.  

\begin{exerc_text} Пусть $M_n(d)$ есть количество циклических последовательностей длины $d$ над алфавитом из $n>1$ букв, переходящих в себя лишь при вращениях на углы, кратные $2\pi$. Покажите, что справедливы равенства
$$
\sum\limits_{d\backslash k} d\, M_n(d)=n^k \qquad \qquad \text{и} \qquad \qquad 
\sum\limits_{d\backslash k} M_n(d)=N_n(k).
$$
Используя эти равенства, формулы (\ref{eq:obr_Meb}) обращения Мебиуса, а также соотношение (\ref{eq:fun_Eul_coeff}), получите следующие явные выражения для чисел $M_n(k)$ и $N_n(k)$:
$$
M_n(k)=\dfrac{1}{k}\sum\limits_{d\backslash k}\mu_d\,n^{k/d},\qquad\qquad
N_n(k)=\dfrac{1}{k}\sum\limits_{d\backslash k}\phi_d\,n^{k/d}.
$$ 
\end{exerc_text}
\end{exerc}

\begin{exerc}
Несложно проверить следующие свойства отношения делимости на множестве $\N$ положительных целых чисел:
\begin{description}
\item[(1)] Рефлексивность: $n\backslash n$.
\item[(2)] Транзитивность: если $d\backslash n$, а $n\backslash m$, то $d\backslash m$.
\item[(3)] Антисимметричность: если $d\backslash n$ и $n\backslash d$, то $d=n$. 
\end{description}

Эти три свойства означают, что делимость вводит на множестве положительных целых чисел \emph{отношение частичного порядка.} 

{\bf Определение.} Частично упорядоченным множеством называется множество $P$ с введенным на нем бинарным отношением $\preceq$ частичного порядка, удовлетворяющим следующим трем свойствам:
\begin{description}
\item[(1)] Рефлексивность: $\forall x\in P$ $x\preceq x$.
\item[(2)] Транзитивность: $\forall x,y,z\in P:$ если $x\preceq y$, а $y\preceq z$, то $x\preceq z$.
\item[(3)] Антисимметричность: $\forall x,y\in P:$ если $x\preceq y$ и $y\preceq x$, то $x=y$. 
\end{description}

Еще одним простым примером частично упорядоченного множества является множество $\Z_+$ с отношением $\leq$ сравнения этих чисел по величине. В частности, это отношение задает на любом  $n$-множестве $[n]=\{1,2,\ldots,n\}$ структуру линейно упорядоченного множества $L_n$.

\begin{exerc_text} Пусть $[n]=\{1,2,\ldots,n\}$, а $P$ есть множество всех подмножеств этого множества $[n]$. Докажите, что отношение $\subseteq$ вводит на $P$ отношение частичного порядка, т.е. что множество $P$ всех подмножеств $n$-элементного множества вместе с отношением $\subseteq$ образует частично упорядоченное множество. Такое частично упорядоченное множество обозначают через $B_n$ и называют булевой алгеброй степени $n$.  
\end{exerc_text}

Видно, что разные виды производящих функций связаны с разными способами частично упорядочить заданное $n$-элементное множество: линейному порядку на $[n]$ отвечает обыкновенная производящая функция, отношению $\subseteq$ соответствует экспоненциальная производящая функция, а отношению делимости $\backslash$ отвечает производящая функция Дирихле. Информацию о других видах производящих функций и их связи с частично упорядоченными множествами можно найти в монографии \cite{Stanley_1}.
\end{exerc}

\begin{exerc}
В заключение приведем несколько упражнений на нахождение явного вида производящих функций для числовых последовательностей.

\begin{exerc_text} Найдите производящие функции для числовых последовательностей
$$
1,2,3,4,5,\ldots;
$$
$$
1\cdot 2,\,2\cdot 3,\,3\cdot 4\,\ldots;
$$ 
$$
1^2,2^2,3^2,4^2,\ldots.
$$
\end{exerc_text}

\begin{exerc_text} Пусть $f(z)$ есть производящая функция для числовой последовательности $a_0,a_1,\ldots$. Выразить через $f(z)$ производящие функции для последовательностей
$$
a_0+a_1,a_1+a_2,a_2+a_3,\ldots;
$$
$$
a_0,a_2,a_4,a_6,a_8,\ldots.
$$
\end{exerc_text}

\begin{exerc_text}
Пусть две числовые последовательности $\{a_n\}$ и $\{c_n\}$ связаны соотношениями
$$
c_n=\sum_{i=0}^n a_i.
$$ 
Выразите производящую функцию $h(z)$ для последовательности $c_n$ через производящую функцию 
$$
f(z)=\sum_{n=0}^{\infty} a_n\,z^n.
$$
\end{exerc_text}

\begin{exerc_text}
Известно, что экспоненциальные производящие функции $F(z)$ и $G(z)$ для числовых последовательностей $\{a_n\}$ и $\{b_n\}$ соответственно связаны соотношением $G(z)=F(z)/(1-z)$. Выразите $b_n$ через $a_n$.
\end{exerc_text}



\end{exerc}

\section*{Решение упражнений}




\begin{sol_exerc}
В результате перемножения рядов 
$$
f(z)=\sum\limits_{k=1}^{+\infty}\dfrac{a_k}{k^z}\qquad\text{и} \qquad g(z)=\sum\limits_{m=1}^{+\infty}\dfrac{b_m}{m^z}
$$
каждое слагаемое $a_k/k^z$ из первого ряда умножается на каждое слагаемое $b_m/m^z$ из второго ряда, добавляя вклад, равный $a_k b_m$, в коэффициент при $1/(km)^z$. Это означает, что для вычисления коэффициента $c_n$ при $1/n^z$ у функции $h(z)=f(z)\cdot g(z)$ нужно перебрать все такие пары $(k,m)$, что $km=n$, и сложить произведения соответствующих коэффициентов в разложениях $f(z)$ и $g(z)$. Таким образом, коэффициенты $c_n$ у функции $h(z)$ рассчитываются по формуле $c_n = \sum\limits_{d\backslash n}a_db_{n/d}$.
\end{sol_exerc}



\begin{sol_exerc}
Очевидно, что количество $\delta_n$ делителей числа $n$ рассчитывается по формуле
$$
\delta_n=\sum_{d\backslash n} 1.
$$
Сравнивая эту формулу с формулой (\ref{eq:num_seq_prod_Dir}), мы видим, что для получения производящей функции $\delta(z)$ числовой последовательности $\delta_n$ достаточно возвести функцию Римана $\zeta(z)$ в квадрат:
$$
\zeta^2(z)=\sum_{n=1}^{\infty} \frac{1}{n^z} \sum_{d\backslash n} 1\cdot 1= \sum_{n=1}^{\infty} \frac{\delta_n}{n^z}=\delta(z).
$$
\end{sol_exerc}



\begin{sol_exerc}
Предположим, что числа $\mu_n$ рассчитываются с использованием описанной в упражнении явной формулы. Покажем, что в этом случае в результате умножения соответствующей этим числам производящей функции $\mu(z)$ на $\zeta$-функцию Римана $\zeta(z)$ мы получим функцию $I(z)$:
$$
\mu(z)\cdot \zeta(z)=\zeta(z)\cdot \mu(z)=I(z)\qquad \Longleftrightarrow \qquad 
\sum\limits_{d\backslash n}\mu_n=\begin{cases}
1,&\text{если $n=1$},\\
0,&\text{если $n>1$}.
\end{cases}
$$

Рассмотрим сумму $\sum_{d\backslash n}\mu_d$ для некоторого фиксированного $n$. Очевидно, что в случае $n=1$ эта сумма равна единице. Возьмем теперь произвольное $n>1$. Пусть его разложение на простые множители имеет следующий вид:
$$
n={p_1}^{\alpha_1} \cdot {p_2}^{\alpha_2} \cdot \dots \cdot {p_k}^{\alpha_k}.
$$
Как следствие, любой делитель $d$ числа $n$ представим в виде 
$$
d={p_1}^{\beta_1}\cdot {p_2}^{\beta_2}\cdot \dots \cdot {p_k}^{\beta_k}
$$ 
для некоторых $\beta_i \leq \alpha_i$. Так как для всех делителей $d$ числа $n$, у которых хотя бы одно из чисел $\beta_i>1$, коэффициенты $\mu_d=0$, то в сумме  $\sum_{d\backslash n}\mu_d$ остаются лишь те слагаемые $\mu_d$, для которых любое из $\beta_i$ в разложении $d$ на множители не превосходит единицы. Иными словами, если наряду с $n$ ввести число $n^*=p_1p_2\ldots p_k$, то у чисел $n$ и $n^*$ суммы $\sum_{d\backslash n}\mu_d$ и $\sum_{d\backslash n^*}\mu_d$ будут совпадать:
$$
\sum_{d\backslash n}\mu_d=\sum_{d\backslash n^*}\mu_d=
\sum\limits_{\beta_1=0}^1\sum\limits_{\beta_2=0}^1\ldots\sum\limits_{\beta_k=0}^1\mu_l,\qquad \text{где} \qquad
l=p_1^{\beta_1} p_2^{\beta_2}\ldots p_k^{\beta_k}.
$$
Используя введенное в упражнении определение чисел $\mu_l$, мы получаем окончательно, что
$$
\sum_{d\backslash n}\mu_d=\sum\limits_{\beta_1=0}^1\sum\limits_{\beta_2=0}^1\ldots\sum\limits_{\beta_k=0}^1
(-1)^{\beta_1+\beta_2+\ldots+\beta_k}.
$$

Теперь заметим, что любая битовая последовательность $(\beta_1,\ldots,\beta_k)$ определяет нам некоторое подмножество множества $[k]$. Мы знаем, что количество четных и нечетных подмножеств любого непустого множества совпадает. Отсюда мы заключаем, что в нашей сумме количество слагаемых, равных $1$, совпадает с количеством слагаемых, равных $(-1)$. Это и означает, что искомая сумма равна нулю для любого $n>1$. 
\end{sol_exerc}



\begin{sol_exerc}
В качестве примера рассмотрим вначале конкретное значение $n$, например, $n=12$. Запишем для этого числа все $12$ правильных дробей со знаменателем, равным $12$:
$$
\dfrac{0}{12},\quad \dfrac{1}{12},\quad \dfrac{2}{12},\quad\dfrac{3}{12},\quad\dfrac{4}{12},\quad\dfrac{5}{12},\quad
\dfrac{6}{12},\quad\dfrac{7}{12},\quad\dfrac{8}{12},\quad\dfrac{9}{12},\quad\dfrac{10}{12},\quad\dfrac{11}{12}.
$$
Сократим, где можно, числитель и знаменатель, а затем сгруппируем эти дроби по их знаменателям:
$$
\dfrac{0}{1};\qquad \dfrac{1}{2};\qquad \dfrac{1}{3},\quad\dfrac{2}{3};\qquad\dfrac{1}{4},\quad\dfrac{3}{4};\qquad
\dfrac{1}{6},\quad\dfrac{5}{6};\qquad\dfrac{1}{12},\quad\dfrac{5}{12},\quad\dfrac{7}{12},\quad\dfrac{11}{12}.
$$
Мы видим, что в знаменателях этих дробей присутствуют все делители $d$ числа $n$. При этом для любого $d$ количество дробей со знаменателем $d$ равно количеству чисел, меньших $d$ и взаимно-простых с $d$. Иными словами, для любого $d$ имеется ровно $\phi(d)$ таких дробей. Но это и означает, что
$$
\sum\limits_{d\backslash n}\phi_d=12=n.
$$
Осталось заметить, что эти рассуждения проходят для произвольного значения $n$. 

Из доказанного тождества следует, что
$$
\zeta(z)\cdot \phi(z)=\sum_{n=1}^{\infty}\frac{1}{n^z} \sum_{d \backslash n}\phi(d)= \sum_{n=1}^{\infty}\frac{1}{n^{z-1}}=\zeta(z-1).
$$
\end{sol_exerc}

\begin{sol_exerc}
Заметим, прежде всего, что у любой циклической строки есть период $d$ --- наименьшее положительное число символов, на которое эту строку нужно повернуть, чтобы она перешла в себя. При этом $d$ делит длину строки $n$. 

Назовём несимметричными те строки длины $d$, для которых период равен $d$. Таковых, по определению, имеется $M_n(d)$ штук. Циклических строк длины $k$ над $n$-символьным алфавитом, имеющих период $d$, также в точности $M_n(d)$ штук: каждую такую строку можно получить, взяв $k/d$ копий одной и той же несимметричной строки длины $d$, разрезав эти строки в произвольном месте и соединив получившиеся $k/d$ обычных строк в цикл. Как следствие, любая циклическая строка длины $k$ обязательно имеет какой-то период и 
$$
\sum\limits_{d\backslash k} M_n(d)=N_n(k).
$$

Получим теперь все обычные, не циклические, строки из циклических путём разрезания циклических строк в какой-то позиции. Если некоторая циклическая строка длины $k$ имела период $d$, то всего имеется $d$ способов разрезать эту строку, приводящих к различным результатам. Таким образом, общее количество строк длины $k$ над $n$-символьным алфавитом равно $\sum\limits_{d\backslash k} d\, M_n(d)$. С другой же стороны, это же количество равно $n^k$. Таким образом, справедливо равенство
$$
\sum\limits_{d\backslash k} d\, M_n(d)=n^k
$$

Применим теперь формулу обращения к последнему равенству и подставим результат в формулу для $N_n(k)$:
$$
M_n(k)=\frac{1}{k} \sum\limits_{d\backslash k} \mu_d\,n^{k/d} \qquad \Longrightarrow \qquad N_n(k) = \sum\limits_{m\backslash k}  \frac{1}{m} \sum\limits_{d\backslash m} \mu_d\,n^{m/d} =  \sum\limits_{m\backslash k}  \frac{1}{m} \sum\limits_{d\backslash m} \mu_{m/d}\,n^{d} .
$$
Поменяем теперь порядок суммирования:
$$
N_n(k) = \sum\limits_{d\backslash k}  n^d \sum\limits_{m \backslash k, \, \,m = q\cdot d} \frac{1}{m} \, \mu_{m/d} = \sum\limits_{d\backslash k}  n^d \sum\limits_{q \backslash (k/d)} \frac{1}{qd} \, \mu_{q}  =
$$

$$
= \frac{1}{k} \sum\limits_{d\backslash k}  n^d\,\frac{k}{d}\sum\limits_{q \backslash (k/d)} \frac{\mu_{q}}{q} = \frac{1}{k} \sum\limits_{d\backslash k}  n^d\,\phi_{k/d} = \frac{1}{k} \sum\limits_{d\backslash k} \phi_{d}\,n^{k/d} .
$$
\end{sol_exerc}



\begin{sol_exerc} 
Отношение $\subseteq$, очевидно, рефлексивно --- любое множество есть подмножество самого себя. Ясно также, что 
для любых трех подмножеств $X,Y,Z\in P$, таких, что $X\subseteq Y$, а $Y\subseteq Z$, выполняется условие $X\subseteq Z$. Наконец, если $X\subseteq Y$ и $Y\subseteq X$, то $X$ совпадает с $Y$, так как в этом случае любой элемент множества $X$ входит в $Y$, а любой элемент $Y$ входит и в $X$.
\end{sol_exerc}

\begin{sol_exerc}
Для первой числовой последовательности
$$
a_n=n+1 \Longrightarrow f_1(z)=\sum\limits_{n = 0}^{+\infty}a_nz^n=\sum\limits_{n =0}^{+\infty}
 (n+1)\,z^n=\Bigl(\sum\limits_{n =0}^{+\infty} z^{n+1}\Bigr)'= \Bigl( \frac{z}{1-z} \Bigr ) '= \dfrac{1}{(1-z)^2}.
$$
Во втором примере
$$
a_n=(n+1)\cdot (n+2)  \Longrightarrow f_2(z)=\sum\limits_{n = 0}^{+\infty}a_nz^n=
\sum_{n \geq 0} (n+1)\,(n+2)\,z^n=\Bigl(\sum\limits_{n =0}^{+\infty} z^{n+2}\Bigr)''= \Bigl( \frac{z^2}{1-z} \Bigr ) ''= \dfrac{2}{(1-z)^3}.
$$ 
Наконец, в третьем примере
$$
a_n=(n+1)^2 = (n+1)(n+2) - (n+1) \Longrightarrow f_3(z)=\sum\limits_{n = 0}^{+\infty}a_nz^n=f_2(z)-f_1(z)=
\dfrac{2}{(1-z)^3} - \dfrac{1}{(1-z)^2}.
$$
\end{sol_exerc}

\begin{sol_exerc}
Производящая функция вида
$$
f(z)+f'(z).
$$
отвечает числовой последовательности вида $(a_0+a_1,a_1+a_2,\ldots)$, а производящая функция
$$
\dfrac{f(\sqrt{z})-f(-\sqrt{z})}{2}
$$
соответствует числовой последовательности $(a_0,a_2,\ldots)$. 
\end{sol_exerc}

\begin{sol_exerc}
Воспользуемся формулой (\ref{eq:num_seq_prod_od}) свертки двух числовых последовательностей. Полагая в ней $b_k=1$, мы получим
$$
c_n=\sum\limits_{k=0}^na_n.
$$
Следовательно, производящая функция $h(z)$ для коэффициентов $c_n$ связана с $f(z)$ формулой вида
$$
h(z)=\dfrac{f(z)}{1-z}.
$$
\end{sol_exerc}



\begin{sol_exerc}
Посмотрим на функции $F(z)$ и $G(z)$ как на {\em обыкновенные} производящие функции для последовательностей $\{a_n/n!\}$ и  $\{b_n/n!\}$. Воспользовавшись результатом предыдущего упражнения, получим, что
$$
\frac{b_n}{n!}=\sum_{i=0}^n \frac{a_i}{i!}\qquad \Longrightarrow \qquad 
{b_n}=\sum_{i=0}^n \frac{a_i \cdot n!}{i!}.
$$
\end{sol_exerc}





\section{Производящие функции и линейные рекуррентные соотношения}

\myitem Ранее мы научились по заданному линейному однородному рекуррентному соотношению с постоянными коэффициентами, связывающему члены $a_n$ числовой последовательности, находить явные выражения для коэффициентов $a_n$ как функций параметра $n$. Используя эти выражения, мы можем, в принципе, записать решение и в виде формального степенного ряда
$$
f(z)=a_0+a_1z+a_2z^2+\ldots+a_nz^n+\ldots.
$$
Однако в большинстве задач такой порядок построения решения не является оптимальным. На практике, как правило, легче по имеющемуся рекуррентному соотношению построить соответствующую данной комбинаторной задаче производящую функцию, используя описанные в предыдущем параграфе операции над формальными степенными рядами. Проиллюстрируем вышесказанное на простом примере \ref{examp:Bona_frog}.

\mysubitem Напомним, что для этого примера нами было получено следующее линейное неоднородное рекуррентное соотношение первого порядка, описывающее изменение популяции лягушек в озере:
\begin{equation}
\label{eq:req_frog}
a_{n+1}=4\,a_n-100,\qquad n=0,1,2,\ldots,\qquad a_0=50.
\end{equation}
Покажем, как восстановить для этой рекуррентной числовой последовательности отвечающую ей обыкновенную производящую функцию.

Пусть
$$
f(z)=a_0+a_1\,z+a_2\,z^2+\ldots+a_nz^n+\ldots
$$
есть искомая обыкновенная производящая функция для числовой последовательности $a_n$, удовлетворяющей уравнению (\ref{eq:req_frog}). Домножим (\ref{eq:req_frog}) на $z^{n+1}$ и просуммируем полученное уравнение по $n$ от $0$ до $+\infty$:
\begin{equation}
\label{eq:req_frog_f_1}
\sum\limits_{n=0}^{+\infty}a_{n+1}\,z^{n+1}=4\sum\limits_{n=0}^{+\infty}a_{n}\,z^{n+1}-
100\sum\limits_{n=0}^{+\infty}z^{n+1}.
\end{equation}
Левая часть этого равенства --- это ``почти'' $f(z)$; переходя в этой сумме к новому индексу суммирования $k=n+1$, $k=1,\ldots,+\infty$, получаем
$$
\sum\limits_{k=1}^{+\infty}a_{k}\,z^{k}=f(z)-a_0.
$$
Первая сумма в правой части равенства (\ref{eq:req_frog_f_1}), очевидно, равна
$$
4\sum\limits_{n=0}^{+\infty}a_{n}\,z^{n+1}=4\,z\sum\limits_{n=0}^{+\infty}a_{n}\,z^{n}=4\,z\,f(z).
$$
Наконец, последнюю сумму в (\ref{eq:req_frog_f_1}) можно свернуть и записать в виде дроби
$$
\sum\limits_{n=0}^{+\infty}z^{n+1}=z\sum\limits_{n=0}^{+\infty}z^{n}=\dfrac{z}{1-z}.
$$
Поэтому окончательно равенство (\ref{eq:req_frog_f_1}) переписывается в виде
$$
\qquad \qquad \qquad \qquad f(z)-a_0=4\,z\,f(z)-100\dfrac{z}{1-z}\qquad \Longrightarrow
$$
\begin{equation}
\label{eq:req_frog_f_2}
\Longrightarrow\qquad
f(z)=\dfrac{a_0}{1-4z}-\dfrac{100\,z}{(1-z)(1-4z)}.
\end{equation}

\mysubitem Итак, мы построили производящую функцию для числовой последовательности $a_n$. Наша же исходная задача заключалась в отыскании явного выражения для этих чисел. Оказывается, что теперь это сделать довольно просто --- достаточно разложить правую часть (\ref{eq:req_frog_f_2}) в ряд по степеням $z$.

С первым слагаемым в правой части (\ref{eq:req_frog_f_2}) справиться легко --- мы знаем, что
$$
g(z)=\dfrac{1}{1-4z}=1+4z+(4z)^2+\ldots.
$$
Для того, чтобы проделать ту же операцию со вторым слагаемым, нам предварительно необходимо разложить эту дробь на простейшие:
$$
\dfrac{z}{(1-z)(1-4z)}=\dfrac{A}{1-z}+\dfrac{B}{1-4z}=\dfrac{A-4Az+B-Bz}{(1-z)(1-4z)}\,\,
\Longrightarrow\,\,
\left\{\begin{aligned}
A+B&=0\\
4A+B&=-1
\end{aligned}\right.\,\,
\Longrightarrow\,\,
\left\{\begin{aligned}
A&=-1/3\\
B&=1/3
\end{aligned}\right.
$$
Как следствие,
$$
-\dfrac{100\,z}{(1-z)(1-4z)}=-\dfrac{100}{3}\left[\sum\limits_{n=0}^{+\infty}
(4^n-1)\,z^n\right],
$$
и мы окончательно для $a_n$ получаем следующее явное аналитическое выражение:
$$
a_n=a_0\,4^n-\dfrac{100}{3}\,[4^n-1]=\dfrac{50}{3}\,\left[4^n+2\right],\qquad n=0,1,2,\ldots.
$$



\myitem Опишем теперь общий алгоритм использования аппарата обыкновенных производящих функций для решения линейных рекуррентных соотношений $m$-го порядка с постоянными коэффициентами:
\begin{enumerate}
\item[(1)] ввести обыкновенную производящую функцию $f(z)$ для числовой последовательности $a_0,a_1,a_2,\ldots$;
\item[(2)] трансформировать заданное рекуррентное соотношение в уравнение для $f(z)$, домножив это соотношение на $z^{n+m}$, просуммировав полученное выражение по $n$ от $0$ до $+\infty$ и выразив каждую из полученных таким образом сумм через $f(z)$;
\item[(3)] разрешить полученное уравнение относительно $f(z)$;
\item[(4)] определить числа $a_n$ как коэффициенты при $z^n$ в разложении $f(z)$ по степеням $z$.
\end{enumerate}

Применим этот алгоритм к линейному неоднородному рекуррентному соотношению $m$-го порядка с постоянными коэффициентами, записанному в следующем виде:
\begin{equation}
\label{eq:lin_rec_m}
b_0a_{n+m}+b_1a_{n+m-1}+\ldots+b_ma_{n}=u_n,\quad n=0,1,2,\ldots,\quad b_0\neq 0,\,\,
\text{$a_0,a_1,\ldots,a_{m-1}$ -- заданы.}
\end{equation}

\mysubitem На первом шаге введем для последовательности $a_0,a_1,a_2,\ldots$ обыкновенную производящую функцию
$$
f(z)=a_0+a_1\,z+a_2\,z^2+\ldots=\sum\limits_{n=0}^{+\infty}a_nz^n.
$$
Домножим (\ref{eq:lin_rec_m}) на $z^{n+m}$ и просуммируем полученное уравнение по $n$ от $0$ до $+\infty$. В полученном соотношении разберем каждое слагаемое отдельно:
$$
\begin{aligned}
b_0\sum\limits_{n=0}^{+\infty}a_{n+m}z^{n+m}&=b_0\,[f(z)-a_0-a_1z-\ldots-a_{m-1}z^{m-1}],\\
b_1z\sum\limits_{n=0}^{+\infty}a_{n+m-1}z^{n+m-1}&=b_1z\,[f(z)-a_0-a_1z-\ldots-a_{m-2}z^{m-2}],\\
&\cdots\\
b_{m-2}z^{m-2}\sum\limits_{n=0}^{+\infty}a_{n+2}z^{n+2}&=b_{m-2}z^{m-2}\,[f(z)-a_0-a_1z],\\
b_{m-1}z^{m-1}\sum\limits_{n=0}^{+\infty}a_{n+1}z^{n+1}&=b_{m-1}z^{m-1}\,[f(z)-a_0],\\
b_{m}z^{m}\sum\limits_{n=0}^{+\infty}a_{n}z^{n}&=b_{m}z^{m}f(z),\\
z^m\sum\limits_{n=0}^{+\infty}u_{n}z^{n}&=:z^{m}u(z).
\end{aligned}
$$
Введем также следующие обозначения:
$$
g(z):=b_0+b_1z+b_2z^2+\ldots+b_{m-1}z^{m-1}+b_mz^m,
$$
$$
c_n=\sum\limits_{i=0}^na_ib_{n-i},\qquad h(z):=\sum\limits_{n=0}^{m-1}c_nz^n.
$$
С учетом этих обозначений и сделанных выше преобразований получается следующее уравнение на производящую функцию $f(z)$:
$$
f(z)\cdot g(z)=b_0a_0+(b_0a_1+b_1a_0)z+\ldots+
(b_0a_{n+m-1}+b_1a_{n+m-2}+\ldots+b_{m-2}a_1+b_{m-1}a_0)z^{m-1}+z^mu(z)=
$$
$$
=\sum\limits_{n=0}^{m-1}c_nz^n+z^mu(z)=h(z)+z^mu(z)\qquad\Longrightarrow
$$
$$
\Longrightarrow\qquad f(z)=\dfrac{h(z)+z^mu(z)}{g(z)}.
$$
Заметим, что деление на $g(z)=b_0+b_1z+\ldots+b_mz^m$ законно --- коэффициент $b_0$ отличен от нуля.

\mysubitem В случае \emph{однородного} линейного рекуррентного соотношения с постоянными коэффициентами
$m$-го порядка производящая функция для рекуррентной последовательности $a_0,a_1,a_2,\ldots$
представляет собой рациональную функцию
$$
f(z)=\dfrac{h(z)}{g(z)}=\dfrac{\sum\limits_{n=0}^{m-1}c_nz^n}{\sum\limits_{n=0}^{m}b_nz^n}.
$$
По сути, этим устанавливается взаимно-однозначное соответствие между линейными однородными
рекуррентными соотношениями на коэффициенты $a_n$ и рациональными производящими функциями.

\mysubitem Как правило, при вычислении явного вида коэффициентов $a_n$ вместо формального деления
степенных рядов целесообразно разложить дробь на простейшие --- элементарные дроби вида
$$
\dfrac{A}{1-\alpha\,z},\qquad\dfrac{B}{(1-\alpha\,z)^2},\qquad\ldots\qquad
\dfrac{D}{(1-\alpha\,z)^m},
$$
а затем воспользоваться готовыми формулами вида (\ref{eq:geom_progr_tot_k}).



\myitem Перейдем теперь к более общему виду линейного рекуррентного соотношения (\ref{eq:req_lin}) с переменными коэффициентами. 

\mysubitem Как вскоре мы увидим, при решении таких уравнений с помощью производящих функций естественным образом возникают производные таких функций. Однако производящая функция --- это формальный степенной ряд, поэтому понятие производной для такой функции требует специального определения.

\begin{defin} Пусть $(a_0,a_1,a_2,\ldots)$ --- некоторая числовая последовательность, и пусть
$$
f(z)=a_0+a_1z+a_2z^2+\ldots
$$
есть формальный степенной ряд для этой последовательности, понимаемый как элемент кольца $\C[[z]]$. Производной ряда $f(z)$ называется формальный степенной ряд вида
$$
a_1+2a_2z+3a_3z^2+\ldots=\sum\limits_{n=1}^{+\infty}n\,a_nz^{n-1}:=f'(z).
$$
Иными словами, производной числовой последовательности $(a_0,a_1,a_2,\ldots)$ в кольце с операцией умножения (\ref{eq:num_seq_prod_od}) называется числовая последовательность
$$
(1\cdot a_1,2\cdot a_2,3\cdot a_3,\ldots).
$$
\end{defin}

\begin{defin} Пусть
$$
F(z)=a_0+a_1\dfrac{z}{1!}+a_2\dfrac{z^2}{2!}+\ldots+a_n\dfrac{z^n}{n!}+\ldots\in\C_e[[z]]
$$
есть формальный степенной ряд для числовой последовательности $(a_0,a_1,a_2,\ldots)$. Производной этого ряда называется формальный степенной ряд вида
$$
F'(z)=a_1+a_2\dfrac{z}{1!}+a_3\dfrac{z^2}{2!}+\ldots+a_{n+1}\dfrac{z^n}{n!}+\ldots
$$
Иными словами, ``экспоненциальной'' производной числовой последовательности $(a_0,a_1,a_2,\ldots)$ является сдвинутая на одну позицию влево числовая последовательность $(a_1,a_2,a_3,\ldots)$.
\end{defin}


\mysubitem Для операции взятия производной в кольцах $\C[[z]]$ и $\C_e[[z]]$ формальных степенных рядов можно выводить свойства, аналогичные привычным нам свойствам производной из классического анализа. При этом вывод этих свойств зачастую оказывается даже более простым по сравнению с аналогичным выводом в курсе математического анализа.

\begin{examp} Докажем, что если $f(z)\in\C[[z]]$ и $f'(z)=0$, то $f(z)=a_0$, т.е. $f(z)$ отвечает числовая последовательность вида $(a_0,0,0,\ldots)$.

Равенство двух формальных степенных рядов означает равенство коэффициентов при соответствующих
степенях $z$. Поэтому равенство $f'(z)=0$ означает, что все коэффициенты левого формального
степенного ряда равны нулю:
$$
n\cdot a_n=0\quad \forall \,n=1,2,\ldots\qquad \Longrightarrow \qquad a_1=a_2=\ldots=0
\qquad \Longrightarrow \qquad f(z)=a_0+0\cdot z+0\cdot z^2+\ldots=a_0.
$$

Очевидно, что это же свойство выполняется и для функции $F(z)\in\C_e[[z]]$.
\end{examp}

\begin{examp} Докажем, что если  $f(z)\in\C[[z]]$ и $f'(z)=f(z)$, то
$$
f(z)=c\cdot\left[1+z+\dfrac{z^2}{2!}+\dfrac{z^3}{3!}+\ldots\right]=:c\cdot e^z.
$$

Как и в предыдущем примере, приравняем коэффициенты рядов $f(z)$ и $f'(z)$ при одинаковых степенях $z$:
$$
n\cdot a_n=a_{n-1}\quad \forall \,n=1,2,\ldots\quad \Longrightarrow \quad
a_n=\dfrac{a_{n-1}}{n}=\dfrac{a_{n-2}}{n\,(n-1)}=\ldots=\dfrac{a_0}{n!}
\quad \Longrightarrow \quad f(z)=a_0\cdot e^z.
$$
\end{examp}

\begin{rem} 
Видно, что и определение, и свойства операции дифференцирования формальных степенных рядов совпадают с определением и свойствами операции дифференцирования функций $f(z)$ комплексного аргумента, аналитических в некоторой малой окрестности точки $z=0$. Этим обстоятельством активно пользуются при решении конкретных рекуррентных соотношений.
\end{rem}


\myitem Перейдем теперь к анализу линейных рекуррентных соотношений с переменными коэффициентами. Начнем, как всегда, с простого примера.

\mysubitem Рассмотрим числовую последовательность, записанную в следующем явном виде:
$$
a_n=\BCf{2n}{n},\qquad n=0,1,2,\ldots
$$
Так как
$$
a_{n+1}=\BCf{2n+2}{n+1}=\dfrac{(2n+2)!}{(n+1)!\cdot(n+1)!}=\dfrac{2(2n+1)(2n)!}{(n+1)\cdot n!\cdot n!}=
\dfrac{2(2n+1)}{n+1}\,a_n,
$$
то числовая последовательность $a_n$ удовлетворяет рекуррентному соотношению
$$
(n+1)a_{n+1}=4n a_n+2  a_n,\qquad n=0,1,2,\ldots,\qquad a_0=1.
$$

\mysubitem Итак, мы решили в каком-то смысле обратную задачу --- мы из явной формулы для коэффициентов $a_n$ вывели рекуррентное соотношение, которому эти коэффициенты удовлетворяют. Постараемся теперь с использованием обыкновенных производящих функций решить прямую задачу, а именно, по заданному рекуррентному соотношению определить явный вид чисел $a_n$.

Для этого домножим наше рекуррентное соотношение на $z^n$ и просуммируем его по $n$ от $0$ до
$+\infty$:
$$
\sum\limits_{n=0}^{+\infty}(n+1)a_{n+1}z^n=
4\sum\limits_{n=0}^{+\infty}n\,a_nz^n+2\sum\limits_{n=0}^{+\infty}a_nz^n=
4z\sum\limits_{n=1}^{+\infty}n\,a_nz^{n-1}+2\sum\limits_{n=0}^{+\infty}a_nz^n.
$$
По определению производной обыкновенной производящей функции,
$$
\sum\limits_{n=1}^{+\infty}n\,a_nz^{n-1}=\sum\limits_{n=0}^{+\infty}(n+1)a_{n+1}z^n=f'(z).
$$
Поэтому предыдущее равенство можно записать в следующем компактном виде:
\begin{equation}
\label{eq:prob_Coshi_od}
(1-4z)\,f'(z)=2f(z),\qquad f(0):=a_0=1.
\end{equation}

\mysubitem Возникает вопрос, как из этого уравнения определить обыкновенную производящую функцию $f(z)$. Стандартный прием здесь состоит в следующем. Соотношение вида (\ref{eq:prob_Coshi_od}) рассматривается как задача Коши для обыкновенного дифференциального уравнения первого порядка. Пусть функция $f(z)$, представляющая собой решение этой задачи, является аналитической функцией комплексного аргумента в некоторой малой окрестности начала координат. В этом случае она единственным образом раскладывается в этой окрестности в степенной ряд вида
$$
f(z)=a_0+a_1z+a_2z^2+\ldots.
$$
При этом, так как операции дифференцирования и умножения таких рядов и формальных степенных рядов $f(z)\in\C[[z]]$ совпадают, то коэффициенты $a_n$ этого ряда удовлетворяют исходному рекуррентному соотношению.

В рассматриваемом примере задача (\ref{eq:prob_Coshi_od}) легко решается методом разделения переменных:
$$
\dfrac{df}{f}=\dfrac{2\,dz}{1-4z}=-\dfrac{1}{2}\dfrac{d(1-4z)}{(1-4z)}\quad\Longleftrightarrow\quad
d\ln(f)=-\dfrac{1}{2}d\ln(1-4z)\quad \Longrightarrow \quad f(z)=\dfrac{1}{\sqrt{1-4z}}.
$$
Полученная функция $f(z)$ комплексного аргумента $z$ является аналитической в окрестности точки $z=0$ --- она раскладывается в степенной ряд в этой окрестности по формуле бинома Ньютона:
$$
f(z)=(1-4z)^{-1/2}=\sum\limits_{n=0}^{+\infty}\BCf{-1/2}{n}(-4z)^n=1+
\sum\limits_{n=1}^{+\infty}\dfrac{(-1/2)(-1/2-1)\ldots(-1/2-n+1)}{n!}(-4)^nz^n=
$$
$$
=1+\sum\limits_{n=1}^{+\infty}\dfrac{1\cdot 3\cdot 5\cdot\ldots\cdot(2n-1)}{n!}2^nz^n=
\left|_{n!2^n=(1\cdot 2)(2\cdot 2)(3\cdot 2)\ldots (n\cdot 2)=2\cdot 4\cdot 6\cdot \ldots\cdot 2n}\right|=
$$
$$
=1+\sum\limits_{n=1}^{+\infty}\dfrac{1\cdot 2\cdot 3\cdot\ldots\cdot(2n-1)(2n)}{(n!)^2}z^n=
\sum\limits_{n=0}^{+\infty}\BCf{2n}{n}z^n.
$$

\mysubitem Заметим, что условие аналитичности функции $f(z)$ в окрестности нуля является в данном алгоритме существенным. Оно обычно выполняется лишь в том случае, если соответствующие коэффициенты $a_n$ растут не слишком быстро. В противном случае описанный выше алгоритм решения рекуррентных соотношений с переменными коэффициентами может перестать работать.

В качестве характерного примера рассмотрим следующее несложное линейное рекуррентное соотношение с переменными коэффициентами:
\begin{equation}
\label{eq:req_fact}
a_{n+1}=(n+1)\,a_n,\qquad n=0,1,2,\ldots,\qquad a_0=1.
\end{equation}
Попытаемся решить его с помощью обыкновенных производящих функций. Домножая рекуррентное соотношение на $z^{n+1}$ и суммируя по $n$ от $0$ до $+\infty$, имеем
$$
\sum\limits_{n=0}^{+\infty}a_{n+1}z^{n+1}=\sum\limits_{n=0}^{+\infty}n\,a_nz^{n+1}+
\sum\limits_{n=0}^{+\infty}a_nz^{n+1}=z^2\sum\limits_{n=0}^{+\infty}n\,a_nz^{n-1}+
z\sum\limits_{n=0}^{+\infty}a_nz^{n}\qquad\Longleftrightarrow
$$
$$
\Longleftrightarrow\qquad f(z)-1=z^2f'(z)+zf(z),\qquad f(0)=1.
$$
Полученная задача Коши не имеет решения, аналитического в окрестности начала координат. Этот результат в данном случае легко объясним. Действительно, исходное рекуррентное соотношение (\ref{eq:req_fact}) настолько простое, что мы легко можем получить явное выражение для коэффициентов
$a_n$:
$$
a_{n+1}=(n+1)\,a_n=(n+1)\,n\,a_{n-1}=\ldots=(n+1)!\,a_0=(n+1)!
$$
Отвечающий этой числовой последовательности степенной ряд
$$
f(z)=a_0+a_1z+a_2z^2+\ldots+n!z^n+\ldots=1+z+2z^2+6z^3+\ldots+n!\,z^n+\ldots,
$$
как уже отмечалось ранее, расходится при любых $z>0$, если рассматривать его с точки зрения обычного математического анализа.

\mysubitem Полученный выше не слишком утешительный результат не означает, однако, что рекуррентное соотношение (\ref{eq:req_fact}) невозможно решить с помощью аппарата формальных степенных рядов. Для того, чтобы понять, как подправить описанный выше алгоритм, заметим следующее: числовой последовательности $a_n=n!$ в кольце $\C_e[[z]]$ формальных степенных рядов отвечает ряд
$$
F(z)=1+1!\cdot \dfrac{z^1}{1!}+2!\cdot \dfrac{z^2}{2!}+\ldots+n!\cdot \dfrac{z^n}{n!}+\ldots=
1+z+z^2+\ldots+z^n+\ldots
$$
Такому степенному ряду в математическом анализе отвечает функция $1/(1-z)$, аналитическая в области $|z|<1$. Следовательно, есть надежда, что заменяя в алгоритме обыкновенную производящую функцию на экспоненциальную, мы сможем добиться успеха.

Действительно, введем для числовой последовательности $a_n$, описываемой рекуррентным соотношением (\ref{eq:req_fact}), экспоненциальную производящую функцию
$$
F(z)=a_0+a_1\dfrac{z}{1!}+a_2\dfrac{z^2}{2!}+\ldots+a_n\dfrac{z^n}{n!}+\ldots
$$
Домножим (\ref{eq:req_fact}) на $z^{n+1}/(n+1)!$ и просуммируем его по $n$:
$$
\sum\limits_{n=0}^{+\infty}a_{n+1}\dfrac{z^{n+1}}{(n+1)!}=
\sum\limits_{n=0}^{+\infty}a_n\dfrac{z^{n+1}}{n!}\qquad \Longleftrightarrow\qquad
F(z)-1=z\,F(z)\qquad \Longrightarrow\qquad F(z)=\dfrac{1}{1-z}.
$$
Итак, в случае, когда коэффициенты $a_n$, отвечающие линейному рекуррентному соотношению с переменными коэффициентами, растут слишком быстро, разумно для решения этого соотношения использовать экспоненциальные производящие функции.

\mysubitem В связи с последним утверждением возникает естественный вопрос: а что, если числовая последовательность $a_n$ будет расти столь быстро, что и отвечающий ей ряд $F(z)$, понимаемый в смысле математического анализа, будет расходиться всюду в окрестности нуля? В принципе такие примеры придумать можно. Однако на практике такие задачи, как правило, все же не встречаются.

\mysubitem Разумеется, не все линейные рекуррентные соотношения с переменными коэффициентами сводятся к линейным алгебраическим уравнениям на экспоненциальные производящие функции. Часто соответствующие этим соотношениям уравнения содержат производные экспоненциальных производящих функций.

Рассмотрим, к примеру, рекуррентное соотношение
\begin{equation}
\label{eq:req_Bell}
B_{n+1}=\sum_{k=0}^n\BCf{n}{k}B_k,\qquad B_0=1
\end{equation}
для чисел Белла $B_n$, описывающих количество всевозможных разбиений $n$-элементного множества. Домножим это равенство на $z^n/n!$ и просуммируем по $n$ от нуля до $+\infty$:
$$
\sum\limits_{n=0}^{+\infty}B_{n+1}\dfrac{z^n}{n!}=\sum\limits_{n=0}^{+\infty}
\sum_{k=0}^n\BCf{n}{k}B_k\dfrac{z^n}{n!}.
$$
В левой части этого равенства стоит, по определению, производная $B'(z)$ рассматриваемой экспоненциальной производящей функции. Правая его часть представляет собой произведение пары экспоненциальных функций --- $B(z)$ и функции
$$
1+1\cdot\dfrac{z}{1!}+1\cdot\dfrac{z^2}{2!}+\ldots+1\cdot \dfrac{z^n}{n!}+\ldots:=e^z.
$$
Следовательно, в терминах экспоненциальных производящих функций равенство (\ref{eq:req_Bell}) записывается так:
$$
B'(z)=e^zB(z),\qquad B(0):=B_0=1.
$$
Рассмотрим теперь последние равенства как задачу Коши для функции $B(z)$ комплексного аргумента $z$. Эта задача легко решается:
$$
d\ln B(z)=d e^z,\qquad B(0)=1 \qquad \Longrightarrow \qquad B(z)=e^{e^z-1}.
$$
Заметим, что получившаяся в результате решения функция $B(z)$ с точки зрения математического анализа представляет собой хоть и быстрорастущую, но аналитическую функцию комплексного аргумента при любом $z\in\C$.



\section*{Упражнения}


\begin{exerc}
Определите производящую функцию $f(z)$ для чисел Фибоначчи. Получите с ее помощью явные выражения для чисел Фибоначчи.
\end{exerc}

\begin{exerc}
Решите с помощью обыкновенных производящих функций следующие линейные рекуррентные соотношения с постоянными коэффициентами:
$$
a_{n+1}=a_{n}+2^n,\qquad a_0=0;
$$ 
$$
a_{n+2}=4a_{n+1}-4a_n,\qquad a_0=a_1=1;
$$
$$
a_{n+3}=-3a_{n+2}-3a_{n+1}-a_n,\qquad a_0=1,\,\,a_1=a_2=0.
$$
\end{exerc}

\begin{exerc}
Пусть числовая последовательность $\{a_n\}$ описывает количество битовых строк длины $n$, в которых между каждой парой единиц расстояние больше или равно трем. Составьте рекуррентное соотношение для этой последовательности и найдите для неё обыкновенную производящую функцию.
\end{exerc}

\begin{exerc} Числами Люка (Lucas numbers) называются числа $L_n$, удовлетворяющие следующему рекуррентному соотношению:
$$
L_{n+2}=L_{n+1}+L_n,\,\,\,n\geq 0;\qquad L_0=2,\,\,\,L_1=1.
$$
Построить для них производящую функцию и найти явное выражение для $L_n$.
\end{exerc}

\begin{exerc} Обобщением чисел Фибоначчи $F_n$ и чисел Люка $L_n$ являются так называемые последовательности Люка $U_n(p,q)$ и $V_n(p,q)$, удовлетворяющие следующим рекуррентным соотношениям:
$$
\begin{array}{lll}
U_{n+2}=p\,U_{n+1}-q\,U_n,\,\,\,n\geq 0;&\qquad& V_{n+2}=p\,V_{n+1}-q\,V_n,\,\,\,n\geq 0;\\[2ex]
U_0=0,\quad U_1=1;  &\qquad&  V_0=2, \quad V_1=p.
\end{array}
$$
Построить производящие функции для этих чисел.
\end{exerc}

\begin{exerc} В случае $p=2$, $q=-1$ числа $U_n(2,-1)$ называются числами Пелла $P_n$ (Pell numbers). Доказать для чисел Фибоначчи $F_n$ и для чисел Пелла $P_n$ так называемую формулу Кассини:
$$
F_{n+1}F_{n-1}-F_n^2=(-1)^n,\qquad P_{n+1}P_{n-1}-P_n^2=(-1)^n.
$$
\end{exerc}

\begin{exerc} В случае $p=1$, $q=-2$ числа $U_n(1,-2)$ называются числами Якобшталля (Jacobsthal numbers). Как выглядит формула Кассини для этих чисел? Можно ли получить эту формулу для общего случая $U_n(p,q)$?
\end{exerc}

\begin{exerc}
Решите с помощью экспоненциальных производящих функций следующие линейные рекуррентные соотношения:
\begin{align*}
&a_{n+1}=2(n+1)a_{n}+(n+1)!,\qquad a_0=0,\\[1.0ex]
&a_{n+2}=a_{n+1}+(n+1)a_n,\qquad a_0=a_1=1,\\[1.0ex]
&a_{n}=na_{n-1}+n(n-1)a_{n-2},\qquad a_0=a_1=1.
\end{align*}
\end{exerc}



\section*{Решения упражнений}

\begin{sol_exerc}\label{ex:gen_funct_Fibb}
Домножим на $z^{n+2}$ и просуммируем по всем $n$ рекуррентное соотношение для чисел Фибоначчи:
$$
\sum_{n \geq 0} F_{n+2}\,z^{n+2}=\sum_{n \geq 0} F_{n+1}\,z^{n+2}+\sum_{n \geq 0} F_n\,z^{n+2}.
$$
Отсюда с учетом равенства $F_0=0$ получаем уравнение вида 
$$
f(z)-z=zf(z)+z^2\,f(z) \qquad \Longrightarrow \qquad f(z)=\dfrac{z}{1-z-z^2}=
\dfrac{1}{\sqrt{5}}\left[\dfrac{1}{z-\phi_1}-\dfrac{1}{1-\phi_2}\right],
$$
где $\phi_{1,2}=(1\pm\sqrt{5})/2$. Из последнего соотношения легко получается явное выражение (\ref{eq:exact_Fibb}) для чисел Фибоначчи. 
\end{sol_exerc}


\begin{sol_exerc}
Введем для числовых последовательностей обыкновенную производящую функцию 
$$
f(z)=a_0+a_1z+a_2z^2+\ldots=\sum_{n\geq 0} a_n\,z^n. 
$$
Домножая первое рекуррентное соотношение на $z^{n+1}$ и суммируя по всем натуральным $n$, получаем, что
$$
\sum_{n \geq 0} a_{n+1}\,z^{n+1}=\sum_{n \geq 0} a_{n}\,z^{n+1}+\sum_{n \geq 0} 2^n\,z^{n+1}.
$$
Тогда,
$$
A(z)=z\cdot A(z)+ \frac{z}{1-2z}\qquad \Longrightarrow\qquad 
A(z)=\frac{z}{(1-z)(1-2z)} = \frac{1}{1-2z}-\frac{1}{1-z}.
$$
Отсюда следует, что $a_n=2^n-1$.

Домножая второе рекуррентное соотношение на $z^{n+2}$ и суммируя по всем $n$ от $0$ до бесконечности, получаем:
$$
\sum_{n \geq 0} a_{n+2}\,z^{n+2}=4\sum_{n \geq 0} a_{n+1}\,z^{n+2}-4\sum_{n \geq 0} a_{n}\,z^{n+2}.
$$
$$
A(z)-z-1=4z\,(A(z)-1)-4z^2\,A(z).
$$
$$
A(z) = \frac{1-3z}{(1-2z)^2}.
$$
Отсюда с использованием формулы (\ref{eq:geom_progr_tot_k}) получаем, что
$$
a_n=(n+1)\,2^n-3n\,2^{n-1}
$$
при всех $n \geq 1$.


Наконец, домножение третьего рекуррентного соотношения на $z^{n+3}$ и суммирование по $n$ дает следующее соотношение:
$$
\sum_{n \geq 0} a_{n+3}\,z^{n+3}=-3\sum_{n \geq 0} a_{n+2}\,z^{n+3}-3\sum_{n \geq 0} a_{n+1}\,z^{n+3} - \sum_{n \geq 0} a_{n}\,z^{n+3} \qquad \Longrightarrow
$$
$$
\Longrightarrow \qquad A(z) - 1 = 3z(A(z) - 1) -3z^2(A(z)-1) -z^3A(z) \qquad \Longrightarrow
$$
$$
\Longrightarrow \qquad A(z) = 1+ \frac{-z^3}{1+3z+3z^2+z^3} = 1+ \frac{-z^3}{(1+z)^3}.
$$
После подстановки в эту функцию переменной $-z$ вместо $z$ мы сможем применить к ней формулу (\ref{eq:geom_progr_tot_k}). При такой замене знак поменяют коэффициенты при нечетных степенях, а значит, для $n \geq 3$ имеем $a_n=\binom{n-1}{2}\cdot (-1)^n$.

\end{sol_exerc}


\begin{sol_exerc}
Составим для последовательности $\{a_n\}$ рекуррентное соотношение. Пусть на $n$-й позиции в какой-нибудь битовой строке длины $n$ стоит единица. Тогда на позициях $n-1$ и $n-2$ единиц быть не должно, так что количество способов выбрать оставшиеся разряды равно $a_{n-3}$. Если же на $n$-й позиции стоит ноль, то количество способов выбрать значения для оставшихся разрядов равно $a_{n-1}$. Следовательно,
$$
a_n=a_{n-1}+a_{n-3}.
$$
Кроме того, 
$$
a_0=1; \quad a_1=2;\quad a_2=3.
$$
Домножим полученное рекуррентное соотношение на $z^n$ и просуммируем результат по $n$ от $n=3$ до бесконечности:
$$
\sum_{n \geq 3} a_n z^n=z \sum_{n \geq 3} a_{n-1} z^{n-1} + z^3 \sum_{n \geq 3} a_{n-3} z^{n-3}.
$$
Отсюда получается следующее уравнение на производящую функцию $f(z)$: 
$$
f(z)-3z^2-2z-1=z(f(z)-2z-1)+z^3f(z)
$$
Разрешая это уравнение относительно $f(z)$, окончательно получаем, что
$$
f(z)=\frac{1+z+z^2}{1-z-z^3}.
$$
\end{sol_exerc}



\begin{sol_exerc}
Составим уравнение на производящую функцию для чисел Люка:
$$
L(z)-z-2=z(L(z)-2)+z^2\,L(z) \qquad \Longrightarrow \qquad L(z)=\dfrac{2-z}{1-z-z^2}.
$$  
Сравнивая данный результат с результатами упражнения \ref{ex:gen_funct_Fibb}, получаем, что числа Люка $L_n$ выражаются через числа Фибоначчи $F_n$ по формуле
$$
L_n=2F_{n+1}-{F_n}.
$$
\end{sol_exerc}



\begin{sol_exerc}
Производящая функция $U_{p,q}(z)$ для последовательности чисел Люка $U_n(p,q)$ удовлетворяет уравнению
$$
U_{p,q}(z)-z=pz\,U_{p,q}(z)-qz^2\,U_{p,q}(z) \qquad \Longrightarrow \qquad U_{p,q}(z)=\frac{z}{1-pz+qz^2}.
$$  
Для числовой последовательности  $V_n(p,q)$ производящая функция определяется так:
$$
V_{p,q}(z)-pz-2=pz(V_{p,q}(z)-2)-qz^2\,V_{p,q}(z) \quad \Rightarrow \quad V_{p,q}(z)=\frac{2-pz}{1-pz+qz^2}.
$$  
Из этих выражений, в частности, следует, что $V_n(p,q)=2U_{n+1}(p,q)-p\,U_n(p,q).$
\end{sol_exerc}



\begin{sol_exerc} 
Заметим, что
$$
F_{n+1}F_{n-1}-F_n^2 = F_{n-1}(F_{n-1}+F_n)-F_n(F_{n-2}+F_{n-1}) = -(F_nF_{n-2}-F_{n-1}^2).
$$ 
Продолжая этот процесс, мы получим, что 
$$
F_{n+1}F_{n-1}-F_n^2 = (F_{2}F_{0}-F_1^2)(-1)^n=(-1)^n.
$$
Для чисел Пелла данное соотношение доказывается аналогично.
\end{sol_exerc}



\begin{sol_exerc}
Обозначим через $\{J_n\}$ последовательность чисел Якобшталля. Для этих чисел мы также можем записать цепочку равенств вида
$$
J_{n+1}J_{n-1}-J_n^2 = J_{n-1}(2J_{n-1}+J_n)-J_n(2J_{n-2}+J_{n-1}) = -2(J_nJ_{n-2}-J_{n-1}^2).
$$ 
Выполнив эту операцию $n$ раз, мы придем к выражению $(J_{2}J_{0}-J_1^2)(-2)^n.$ Таким образом, для чисел Якобшталля формула Кассини принимает вид 
$$
J_{n+1}J_{n-1}-J_n^2 = (-2)^n.
$$

Решим теперь задачу в общем виде. Для краткости обозначим $\{U_n\} \eq \{U_n(p,q)\}$. Тогда
$$
U_{n+1}U_{n-1}-U_n^2 = U_{n-1}(-qU_{n-1}+pU_n)-U_n(-qU_{n-2}+pU_{n-1}) = -q(U_nU_{n-2}-U_{n-1}^2).
$$
Следовательно, 
$$
U_{n+1}(p,q)\cdot U_{n-1}(p,q)-U_n^2(p,q) = (-q)^n.
$$
\end{sol_exerc}


\begin{sol_exerc}
Домножим первое рекуррентное соотношение на $z^n/n!$ и просуммируем результат по $n$:
$$
\sum_{n \geq 0} a_{n+1} \frac{z^{n+1}}{(n+1)!}=2z \sum_{n \geq 0} a_{n} \frac{z^{n}}{n!}+ \sum_{n \geq 0} n! \frac{z^{n}}{n!}.
$$
Отсюда следует такое уравнение на экспоненциальную производящую функцию для числовой последовательности $a_n$:
$$
F(z)=2z\,F(z)+\frac{1}{1-z}\qquad \Longrightarrow\qquad 
F(z)=\frac{z}{(1-z)(1-2z)} = \frac{1}{1-2z}-\frac{1}{1-z}=\sum_{n\geq 0} (2^n-1)\,n!\frac{z^n}{n!}.
$$
Поэтому
$$
a_n=(2^n-1)\,n!
$$

Второе уравнение удобнее домножить на $z^{n+1}/(n+1)!$:
$$
\sum_{n \geq 0} a_{n+2} \frac{z^{n+1}}{(n+1)!}= \sum_{n \geq 0} a_{n+1} \frac{z^{n+1}}{(n+1)!}+ \sum_{n \geq 0} a_n \frac{z^{n+1}}{n!}.
$$
Отсюда получается дифференциальное уравнение на производящую функцию $F(z)$ вида
$$
F'(z)-1=F(z)-1+zF(z).
$$
Интегрируя это уравнение с разделяющимися переменными, получаем
$$
\int \frac{dF}{F}=\int (1+z)dz\qquad \Longrightarrow\qquad 
F(z)=e^{z+\frac{z^2}{2}+C}=e^{z+\frac{z^2}{2}},
$$
так как константа равна нулю из начальных условий.

Наконец, для третьего рекуррентного соотношения имеем
$$
\sum_{n \geq 2} a_{n} \frac{z^{n}}{n!}= \sum_{n \geq 2} a_{n-1} \frac{z^{n}}{(n-1)!}+ \sum_{n \geq 2} a_{n-2} \frac{z^{n}}{(n-2)!},
$$
поэтому
$$
F(z)-z-1=zF(z)-z+z^2F(z)\qquad \Longrightarrow\qquad 
F(z)=\frac{1}{1-z-z^2}.
$$
\end{sol_exerc}




\section{Числа Каталана. Нелинейные рекуррентные соотношения}

\myitem Начнем с характерного примера --- с подсчета так называемых правильных скобочных последовательностей.

\mysubitem Как известно, порядок вычислений в любом арифметическом выражении можно однозначно задать расстановкой скобок. Давайте возьмем какое-то достаточно произвольное арифметическое выражение, например,
$$
(3-1)\cdot(4+(15-9)\cdot(2+6)),
$$
и сотрем в нем все числа и знаки арифметических операций. В результате такого действия мы получим последовательность открывающихся и закрывающихся скобок
$$
()(()()),
$$
представляющую собой так называемую правильную скобочную последовательность.

\begin{defin} Правильная скобочная последовательность --- это строка, состоящая из $n$ открывающихся и $n$ закрывающихся скобок, обладающая следующим свойством: при проходе вдоль этой структуры слева направо количество открывающихся скобок всегда больше или равно количеству закрывающихся скобок.
\end{defin}

Перечислим все правильные скобочные последовательности с числом \emph{пар} скобок $n=1,2,3$:
$$
\begin{array}{cll}
n=1:\quad & ()\,\,&\text{-- 1 последовательность};\\
n=2:\quad & ()(),\,\,(())\,\,&\text{-- 2 последовательности};\\
n=3:\quad & ()()(),\,\,()(()),\,\,(())(),\,\,(()()),\,\,((()))\,\,&\text{-- 5 последовательностей}.
\end{array}
$$
Числа $C_n$, описывающие количество таких последовательностей, называются \emph{числами
Каталана.} Как мы увидим несколько позднее, удобно по определению положить $C_0=1$.

Последовательность чисел Каталана
$$
1,1,2,5,14,42,132,429,1430,\ldots
$$
(последовательность $A000108$ в \texttt{OEIS} (\texttt{oeis.org})) встречается в огромном количестве различных комбинаторных задач. В книге \cite{Stanley_2} приведено порядка $100$ задач, в которых эти числа появляются. Приведем лишь несколько наиболее важных из них.

\mysubitem Рассмотрим вначале очень простую интерпретацию правильной скобочной последовательности --- задачу об очереди в кассу (см. \cite{Vilenkin}). Предположим, что у кассы кинотеатра стоит  очередь, состоящая из $2n$ человек. У половины из них имеется по $100$ рублей, у второй половины --- по $50$ рублей. Билет в кино стоит $50$ рублей. В начале продажи билетов касса кинотеатра пуста. Спрашивается, сколькими способами можно расставить людей в очереди правильно, т.е. так, чтобы никому не пришлось ждать у кассы сдачу.

Очевидно, что между этой задачей и задачей о количестве правильных скобочных последовательностей имеется биекция: любому человеку, имеющему $50$ рублей, отвечает открывающаяся скобка в правильной скобочной последовательности, а человеку со $100$ рублями --- закрывающаяся скобка.

\mysubitem Задачу об очереди в кассу часто формулируют более формально, а именно, как задачу о подсчете количества различных \emph{слов Дика} длины $2n$. Словом Дика называют строку длины $2n$ над алфавитом, состоящим из двух символов (например, $X$ и $Y$), в которой количество символов $X$ и $Y$ совпадает, и в которой никакой начальный сегмент строки не содержит символов $Y$ больше, чем символов $X$. В этой формулировке биекция с задачей о подсчете правильных скобочных последовательностей имеет, очевидно, вид
$$
(\,\,\,\,\longleftrightarrow\,\,X,\qquad\qquad\qquad)\,\,\longleftrightarrow\,\,Y.
$$

\mysubitem К задаче о подсчете правильных скобочных последовательностей сводится, очевидно, и задача о перечислении путей на плоскости, выходящих из начала координат, состоящих из отрезков $(1,1)$ и $(1,-1)$, заканчивающихся в точке $(2n,0)$ на оси абсцисс и нигде не пересекающих эту ось. Такие пути на плоскости называются \emph{путями Дика.} Биекция с правильными скобочными последовательностями здесь такова:
$$
(\,\,\,\,\longleftrightarrow\,\,\mbox{вектор $(1,1)$},\qquad\qquad\qquad
)\,\,\longleftrightarrow\,\,\mbox{вектор $(1,-1)$}.
$$

\mysubitem Одной из основных дискретных структур, использующихся в теории алгоритмов, является плоское корневое бинарное дерево, иногда называющаяся просто бинарным или двоичным деревом. Рекурсивно такую структуру можно задать следующим образом:
\begin{itemize}
\item[\normalfont 1)] пустое плоское корневое дерево является, по определению, плоским корневым бинарным деревом;
\item[\normalfont 2)] пусть $r$ --- это некоторый элемент данных, $\rho$, $\lambda$ --- несвязные (т.е. не имеющие общих элементов) плоские корневые бинарные деревья, не содержащие элемента $r$; тогда объединение $\beta=(\lambda,r,\rho)$ этих объектов является плоским корневым бинарным деревом, в котором $r$ является корнем, $\lambda$ --- левым, а $\rho$ --- правым поддеревом дерева $\beta$.
\end{itemize}
Иными словами, плоское корневое бинарное дерево --- это корневое дерево, в котором любая вершина имеет ровно двух (возможно, пустых) потомков --- левого и правого. В упражнении \ref{ex:plane_bin_root_tree_Cat} предлагается доказать, что количество таких деревьев описывается числами Каталана.

\mysubitem Рассмотрим выражение вида
\begin{equation}
\label{eq:non_assotiative_eq}
a_1\cdot a_2\cdot a_3\cdot \ldots \cdot a_n\cdot a_{n+1},
\end{equation}
где элементы $a_i$ принадлежат множеству $S$ с введенной на нем неассоциативной бинарной операцией $'\cdot'$. Очевидно, что это выражение не имеет смысла до тех пор, пока мы не расставим скобки так, чтобы указать на последовательность проводимых операций. Несложно убедиться, что количество расстановки скобок в описанном выше выражении есть число Каталана $C_n$ (смотри упражнение \ref{ex:non_assot_seq_Cat}).

\mysubitem Еще одна важная комбинаторная интерпретация чисел Каталана появилась впервые в работах Леонарда Эйлера (и, кстати сказать, задолго до работ самого Эжена Каталана). Эйлер рассмотрел количество разбиений выпуклого $(n+2)$-угольника с занумерованными (т.е. различимыми) вершинами на треугольники непересекающимися между собой диагоналями этого $(n+2)$-угольника.

В упражнении \ref{ex:triangul_Cat} предлагается доказать, что это количество описывается числами Каталана $C_n$, установив биекцию между всеми триангуляциями выпуклого $(n+2)$-угольника и плоскими корневыми бинарными
деревьями, построенными на $n$ вершинах. 

\mysubitem Рассмотрим теперь все плоские корневые деревья, построенные на $(n+1)$-й вершине, $n=0,1,2,\ldots$. Количество таких деревьев также равно числу Каталана $C_n$. Для того, чтобы это понять, осуществим в любом таком дереве поиск в глубину. При движении вдоль некоторого ребра вниз, т.е. от корня, сопоставим этому ребру левую открывающуюся скобку. При движении в обратном направлении сопоставим этому же ребру закрывающуюся скобку. Тем самым мы устанавливаем биекцию между всеми такими деревьями и всеми правильными скобочными последовательностями.

\mysubitem Наконец, перейдем к еще одному полезному понятию --- стек-сортируемой последовательности. Согласно Кнуту \cite{knut}, стек-сортируемая последовательность --- это линейно упорядоченный набор из $n$ чисел, который можно получить из линейно упорядоченной последовательности $(1,2,\ldots,n)$ с помощью единственного стека.

В качестве примера рассмотрим последовательность чисел $(1,2,3,4)$. Разместим ее справа от стека и будем сдвигать ее влево, помещая числа в стек и вынимая их из этого стека с помощью следующей последовательности действий:
\begin{list}{--}{\parsep=-16pt plus 1pt}
\item поместить число $1$ в стек;\\
\item поместить число $2$ в стек;\\
\item извлечь число $2$ из стека;\\
\item поместить число $3$ в стек;\\
\item поместить число $4$ в стек;\\
\item извлечь число $4$ из стека;\\
\item извлечь число $3$ из стека;\\
\item извлечь число $1$ из стека.
\end{list}
В результате этих действий мы получим линейно упорядоченный набор чисел $(2,4,3,1)$.

Возникает вопрос: сколько различных наборов чисел можно получить из последовательности $(1,2,\ldots,n)$ с помощью подобных операций? Ответ, конечно же, вполне ожидаем --- это количество равно числу Каталана $C_n$.

Для того, чтобы убедиться в этом, достаточно установить следующую биекцию между парой используемых в алгоритме операций и парой скобок:
$$
(\,\,\,\,\longleftrightarrow\,\,\mbox{поместить число в стек},\qquad\qquad\qquad)
\,\,\longleftrightarrow\,\,\mbox{извлечь число из стека}.
$$

\myitem Теперь, после стольких примеров, пора научиться вычислять числа Каталана. Начнем с вывода рекуррентного соотношения для этих чисел. В качестве основного объекта мы выберем множество всех правильных скобочных последовательностей. Рекуррентное соотношение для чисел $C_n$ получим, воспользовавшись хорошо нам уже знакомым принципом разбиения множества на блоки и подсчетом количества элементов в каждом из блоков в отдельности.

\mysubitem Рассмотрим произвольную правильную скобочную последовательность. Для любой открывающейся скобки в такой последовательности можно ввести понятие парной ей закрывающейся скобки. Для этого будем идти от открывающейся скобки вправо и для каждой закрывающейся скобки будем проверять условие ``количество закрывающихся скобок равно количеству открывающихся скобок''. Первая закрывающаяся скобка, для которой это правило выполнится, и будет парной для нашей открывающейся скобки.

\mysubitem Разобъем теперь множество всех правильных скобочных последовательностей на блоки. Для этого возьмем крайнюю левую открывающуюся скобку в правильной скобочной последовательности и поместим в $k$-й блок все правильные скобочные последовательности, для которых парная ей закрывающаяся скобка стоит на $2k$-м месте.

Так, в случае $n=3$ имеем разбиение множества, состоящего из пяти различных правильных скобочных последовательностей, на три блока:
$$
\underbrace{()()(),\qquad ()(())}_{k=1};\qquad\qquad
\underbrace{(())()}_{k=2};\qquad\qquad
\underbrace{(()()),\qquad ((()))}_{k=3}.
$$

\mysubitem Рассмотрим крайнюю левую открывающуюся и парную ей закрывающуюся скобки --- выделенную пару скобок в нашей последовательности. Основное наблюдение здесь состоит в следующем: как внутри, так и снаружи указанной пары скобок стоят правильные скобочные последовательности.

Действительно, рассмотрим вначале последовательность скобок, находящуюся внутри выделенной пары скобок. Мы выбирали выделенную пару из того условия, что в подпоследовательности скобок, начинающейся с крайней левой открывающейся скобки и заканчивающейся парной ей закрывающейся скобкой, количество открывающихся скобок равно количеству закрывающихся скобок. Но, если мы крайнюю пару скобок удалим, то это условие для оставшейся скобочной подпоследовательности сохранится. Условие ``количество открывающихся скобок больше или равно количеству закрывающихся скобок'' в этой подпоследовательности также выполняется --- в противном случае оно бы было нарушено и для всей последовательности скобок в целом.

Проверка того, что и правая подпоследовательность является правильной, проводится с помощью аналогичных рассуждений.

\mysubitem Подсчитаем теперь количество элементов в $k$-м блоке. Для этого заметим, что количество способов построить правильную скобочную последовательность внутри выделенной пары скобок равно, очевидно, $C_{k-1}$. Вне зависимости от выбора этой последовательности мы $C_{n-k}$ способами можем построить правильную скобочную подпоследовательность справа от выделенной пары скобок. Следовательно, по правилу произведения в каждом блоке существует $C_{k-1}\cdot C_{n-k}$ способов построить правильную скобочную последовательность длины $2n$. Общее же число способов получить такую последовательность согласно правилу суммы равно
\begin{equation}
\label{eq:Catalan_req_seq}
C_n=\sum\limits_{k=1}^{n}C_{k-1}\,C_{n-k},\qquad n=1,2,\ldots;\qquad C_0=1.
\end{equation}

Заметим, что рекуррентное соотношение для чисел Каталана является нелинейным. Кроме того, $n$-й член последовательности $C_n$ зависит от всех $n$ предыдущих членов этой последовательности.

\myitem Постараемся решить рекуррентное соотношение (\ref{eq:Catalan_req_seq}).

\mysubitem Для этого введем обыкновенную производящую функцию для последовательности чисел Каталана:
$$
f(z)=C_0+C_1z+C_2z^2+\ldots+C_nz^n+\ldots
$$
Домножим (\ref{eq:Catalan_req_seq}) на $z^n$ и просуммируем полученное равенство по $n$ от единицы до $+\infty$:
$$
\sum\limits_{n=1}^{+\infty}C_nz^n=\sum\limits_{n=1}^{+\infty}z^n\Bigl(
\sum\limits_{k=1}^{n}C_{k-1}\,C_{n-k}\Bigr)\qquad \Longleftrightarrow\qquad
f(z)-1=z\biggl(\sum\limits_{n=1}^{+\infty}z^{n-1}
\Bigl(\sum\limits_{k=1}^{n}C_{k-1}\,C_{n-k}\Bigr)\biggr).
$$
Заметим теперь, что
$$
\sum\limits_{n=1}^{+\infty}z^{n-1}
\Bigl(\sum\limits_{k=1}^{n}C_{k-1}\,C_{n-k}\Bigr)=\left|_{m=n-1;\,n=m+1;\,m=0,1,\ldots}\right|=
\sum\limits_{m=0}^{+\infty}z^{m}
\Bigl(\sum\limits_{k=1}^{m+1}C_{k-1}\,C_{m+1-k}\Bigr)=
$$
$$
=\left|_{i=k-1;\,k=i+1;\,i=0,\ldots,m}\right|=
\sum\limits_{m=0}^{+\infty}z^{m}
\Bigl(\sum\limits_{i=0}^{m}C_{i}\,C_{m-i}\Bigr)=f(z)\cdot f(z)
$$
по определению произведения обыкновенных производящих функций. Следовательно, функция $f(z)$ определяется из следующего равенства:
\begin{equation}
\label{eq:Catalan_od_gen_fun}
f(z)=1+z\,f^2(z).
\end{equation}

\mysubitem Как видно, нелинейное рекуррентное соотношение (\ref{eq:Catalan_req_seq}) для чисел $C_n$ приводит к нелинейному же уравнению (\ref{eq:Catalan_od_gen_fun}) на производящую функцию $f(z)$. Как правило, решение такого рода уравнений строится с помощью формулы обращения Лагранжа, о которой подробно будет рассказано в следующей главе. Мы же сейчас вновь воспользуемся подробно описанным в первом параграфе данной главы подходом, основанным на связи формальных степенных рядов с функциональными рядами из математического анализа.

Именно, предположим, что имеется функция $f(z)$ комплексного аргумента $z$, аналитическая в окрестности точки $z=0$ и удовлетворяющая уравнению (\ref{eq:Catalan_od_gen_fun}). Тогда эта функция единственным образом раскладывается в окрестности точки $z=0$ в степенной ряд
$$
f(z)=C_0+C_1z+C_2z^2+\ldots
$$
При этом, так как правила сложения и умножения таких рядов и формальных степенных рядов $f(z)\in\C[[z]]$ совпадают, то коэффициенты $C_n$, полученные в результате такого разложения, будут удовлетворять исходному рекуррентному соотношению (\ref{eq:Catalan_req_seq}).

Итак, все, что нам остается сделать --- это найти функцию $f(z)$, аналитическую в окрестности точки $z=0$ и удовлетворяющую уравнению (\ref{eq:Catalan_od_gen_fun}), а затем разложить ее по степеням $z^n$ в окрестности этой точки. Для этого разрешим уравнение (\ref{eq:Catalan_od_gen_fun}) относительно функции $f(z)$:
$$
f(z)=\dfrac{1\pm\sqrt{1-4z}}{2z}.
$$
Решение
$$
f(z)=\dfrac{1+\sqrt{1-4z}}{2z}
$$
расходится в окрестности точки $z=0$, поэтому его следует исключить из рассмотрения. Второе решение
\begin{equation}
\label{eq:gen_funct_num_Cat}
f(z)=\dfrac{1-\sqrt{1-4z}}{2z}=\dfrac{1}{2z}-\dfrac{1}{2z}\,(1-4z)^{1/2}
\end{equation}
разложим в ряд в окрестности точки $z=0$, используя формулу бинома Ньютона:
$$
f(z)=\dfrac{1}{2z}-\dfrac{1}{2z}\,\Bigl(1+\sum\limits_{n=1}^{+\infty}
\dfrac{(1/2)(1/2-1)(1/2-2)\ldots(1/2-n+1)}{n!}(-4z)^n\Bigr)=
$$
$$
=-\dfrac{1}{2z}\sum\limits_{n=1}^{+\infty}
(-1)^{n-1}\dfrac{1\cdot 1\cdot 3\cdot 5\cdot\ldots\cdot(2n-3)}{2^n n!}(-4)^nz^n=
\sum\limits_{n=1}^{+\infty}\dfrac{2^{n-1}\cdot 1\cdot 3\cdot 5\cdot\ldots\cdot(2n-3)}{n!}z^{n-1}=
$$
$$
=\sum\limits_{n=1}^{+\infty}\dfrac{(2n-2)!}{n\,((n-1)!)^2}\,z^{n-1}=
\left|_{n'=n-1;\,n=n'+1;\,n'=0,1,2,\ldots}\right|
=\sum\limits_{n'=0}^{+\infty}\dfrac{(2n')!}{(n'+1)\,(n'!)^2}\,z^{n'}.
$$
Следовательно, числа Каталана могут быть выражены через биномиальные коэффициенты по формуле
\begin{equation}
\label{eq:num_Catalan_an}
C_n=\dfrac{1}{n+1}\BCf{2n}{n},\qquad n=0,1,2,\ldots
\end{equation}

\mysubitem Явная аналитическая формула (\ref{eq:num_Catalan_an}) для чисел Каталана, переписанная в виде
$$
C_n=\BCf{2n}{n}-\BCf{2n}{n+1},\qquad n=0,1,2,\ldots,
$$
допускает следующее элегантное комбинаторное доказательство, принадлежащее французскому математику A.Andr\'{e} (1878). Общее количество всех возможных расстановок $n$ открывающихся и $n$ закрывающихся скобок в строке из $2n$ символов равно, очевидно,
$$
P(2n;n,n)=\dfrac{(2n)!}{n!\cdot n!}=\BCf{2n}{n},
$$
где $P(2n;n,n)$ --- количество перестановок с повторениями в строке длины $2n$  $n$ неразличимых символов первого сорта и $n$ неразличимых символов второго сорта (см. параграф 5 главы 1). Осталось из этого количества вычесть ``неправильные'' скобочные последовательности, т.е. такие, в которых нарушается условие ``при проходе строки слева направо количество открывающихся скобок больше или равно количеству закрывающихся скобок''.

Для этого рассмотрим любую такую ``неправильную'' скобочную последовательность. Найдем в этой строке первую закрывающуюся скобку, в которой условие ``правильности'' нарушается. Эта скобка будет стоять на $(2k+1)$-й позиции для некоторого $k=0,1,2,\ldots,$ а слева от нее в подстроке длины $2k$ количество открывающихся скобок, равное $k$, в точности равно количеству закрывающихся скобок. Теперь заменим в получившейся подстроке длины $(2k+1)$ все открывающиеся скобки закрывающимися и наоборот. В результате получим некоторую строку длины $2n$, содержащую ровно $(n+1)$ открывающуюся скобку и ровно $(n-1)$ закрывающуюся.

Теперь возьмем \emph{любую} строку длины $2n$, содержащую $(n+1)$ открывающуюся скобку и $(n-1)$ закрывающуюся. Оказывается, ее всегда можно превратить в \emph{неправильную} скобочную последовательность обратным преобразованием. Действительно, будем идти вдоль такой строки слева направо и проверять условие ``количество закрывающихся скобок больше или равно количеству открывающихся скобок''. Так как общее количество открывающихся скобок в такой строке строго больше общего количества закрывающихся скобок, то обязательно найдется открывающаяся скобка, для которой это условие нарушится. Она будет стоять на $(2k+1)$-й позиции, а слева от нее будет стоять подстрока длины $2k$, в которой количество закрывающихся скобок (равное $k$) равно количеству открывающихся скобок. Меняя в такой подстроке открывающиеся скобки на закрывающиеся и наоборот, мы получаем строку, состоящую из $n$ открывающихся и $n$ закрывающихся скобок, в которой на $(2k+1)$-й позиции нарушается условие правильности скобочной последовательности.

Итак, мы установили взаимно-однозначное соответствие между множеством всех неправильных скобочных последовательностей и множеством всех строк длины $2n$, содержащих $(n+1)$ открывающуюся скобку и $(n-1)$ закрывающуюся скобку. Мощность последнего множества равна, очевидно,
$$
P(2n;n+1,n-1)=\dfrac{(2n)!}{(n+1)!\cdot (n-1)!}=\BCf{2n}{n+1}.
$$
Согласно принципу биекции, этому же числу равна и мощность множества всех неправильных скобочных последовательностей длины $2n$. Как следствие, количество всех правильных скобочных последовательностей равно
$$
P(2n;n,n)-P(2n;n+1,n-1)=\BCf{2n}{n}-\BCf{2n}{n+1}=\dfrac{1}{n+1}\BCf{2n}{n}=C_n,
$$
что и требовалось доказать.


\section*{Упражнения}

\begin{exerc}
Доказать, что количество путей на плоскости, выходящих из начала координат, приходящих в точку с координатами $(n,n)$, состоящих из отрезков $(0,1)$ и $(1,0)$, и не поднимающихся выше диагонали $x=y$, описывается числами Каталана.
\end{exerc}

\begin{exerc}\label{ex:plane_bin_root_tree_Cat}
Установить биекцию множества плоских бинарных корневых деревьев, построенных на $n$ вершинах,  с правильными скобочными последовательностями длины $2n$, доказав, тем самым, что количество таких деревьев равно числу Каталана $C_n$.
\end{exerc}

\begin{exerc}
Доказать, что количество \emph{полных} плоских корневых бинарных деревьев (т.е. деревьев, у которых любая вершина имеет либо ровно двух потомков, либо ни одного) с $(n+1)$-м листом равно числу Каталана $C_n$.
\end{exerc}

\begin{exerc}\label{ex:non_assot_seq_Cat}
Доказать, что количество расстановки скобок в выражениях вида (\ref{eq:non_assotiative_eq}) описывается числами Каталана $C_n$.
\end{exerc}

\begin{exerc}\label{ex:triangul_Cat}
Установить биекцию между всеми триангуляциями выпуклого $(n+2)$-угольника и плоскими корневыми бинарными
деревьями, построенными на $n$ вершинах. Изобразить эту биекцию на рисунке для одной из конкретных триангуляций выпуклого шестиугольника.
\end{exerc}

\begin{exerc} 
Наряду с триангуляциями можно рассматривать произвольные рассечения правильного многоугольника хордами, которые могут пересекаться лишь в вершинах этого многоугольника. Например, существует три рассечения квадрата — пустое рассечение (без хорд) и два рассечения на пару треугольников, отличающихся тем, какая из диагоналей в этом квадрате была проведена. Пусть $S_n$ — количество рассечений $(n+1)$-угольника. Последовательность $\{S_n\}$ называется последовательностью малых чисел Шрёдера. Вывести для неё рекуррентное соотношение.
\end{exerc}


\begin{exerc} 
Рассмотрим множество путей, исходящих из точки с координатами $(0,0)$, приходящих в точку с координатами $(n,0)$, состоящих из отрезков $(1,1)$, $(1,-1)$ и $(1,0)$, и нигде не опускающихся ниже оси абсцисс. Такие пути называются путями Моцкина. Вывести рекуррентное соотношение для подсчета количества $M_n$ всех таких путей. 
\end{exerc}

\begin{exerc} 
Используя прямые комбинаторные соображения, доказать, что 
$$
M_n=\sum\limits_{k=0}^{[n/2]} C_k  \binom{n}{2k},
$$
где $C_k$ --- числа Каталана.
\end{exerc}

\begin{exerc} 
Числа Деланноя $D(m,n)$ описывают количество путей на плоскости из точки $(0,0)$ в точку $(m,n),$ состоящих из шагов вида $(0,1)$, $(1,0)$ и $(1,1).$ Доказать, что эти числа в случае $n \geq m$ рассчитываются по формуле
$$
D(m,n)=\sum\limits_{k=0}^m \binom{m}{k} \binom{n+m-k}{m}.
$$
\end{exerc}

\section*{Решения упражнений}

\begin{sol_exerc}
Любому пути на плоскости можно сопоставить правильную скобочную последовательность по следующему правилу: шагу (1,0) соответствует открывающаяся скобка, а шагу (0,1) --- закрывающаяся. В любом префиксе получившейся последовательности открывающихся скобок будет не меньше, чем закрывающихся, так как наш путь нигде не пересекает прямую $x=y$. 

Обратимость этого преобразования очевидна. Таким образом, установлена биекция между путями на плоскости и правильными скобочными последовательностями длины $2n$, что и доказывает сформулированное в задаче утверждение.
\end{sol_exerc}

\begin{sol_exerc}
Закодируем бинарное дерево правильной скобочной последовательностю по следующему правилу. Если дерево пустое, то код для него тоже пустой. Если же дерево имеет корень $x$, а коды левого и правого поддеревьев равны, соответственно, $\alpha$ и $\beta$, то код для всего дерева есть $(\alpha)\beta$. 

Чтобы восстановить дерево по скобочной последовательности, нужно сделать следующее. Если последовательность пустая, то и дерево будет пустым. В противном случае нужно найти в данной последовательности закрывающуюся скобку, соответствующую первой по порядку открывающейся скобке, и представить последовательность в виде $(\alpha)\beta$. После этого следует добавить в дерево корневую вершину и рекурсивно восстановить два поддерева по последовательностям $\alpha$ и $\beta$.
\end{sol_exerc}


\begin{sol_exerc}
Вначале докажем, что в полном бинарном дереве, имеющем $n+1$ лист, ровно $n$ внутренних вершин. Проще всего сделать это по индукции. Для дерева на одной вершине это утверждение верно. В полном бинарном дереве, имеющем $n+1$ лист, всегда можно найти внутреннюю вершину, оба потомка которой --- листья. Удалив эти листья из дерева, мы получим полное бинарное дерево с $(n-1)$-й внутренней вершиной и $n$ листьями по предположению индукции. Значит, исходное дерево содержало $n$ внутренних вершин.

Теперь легко построить биекцию из множества полных бинарных деревьев с $n+1$ листом в множество всех бинарных деревьев на $n$ вершинах --- для этого надо удалить из исходного дерева все листья. 
\end{sol_exerc}



\begin{sol_exerc}
Проще всего доказать сформулированное в упражнении утверждение, составив рекуррентное соотношение для всевозможных расстановок скобок. Обозначим количество способов расставить скобки через $C_{n}$. В заданном в условии задачи выражении выполняется $n$ операций. В процессе выполнения этих операций какая-то из операций (например, $i$-я) выполнится последней. При этом две части выражения, которые стоят слева и справа от этой операции, уже будут вычислены $C_i$ и $C_{n-i-1}$ способами соответственно. Теперь заметим, что $i$ может быть любым в промежутке от 0 до $n-1$. Кроме того, для $n=0$ есть ровно один способ расставить скобки в выражении  --- не расставлять никаких скобок. Тогда для $C_n$ получаем рекуррентное соотношение вида
$$
C_n = \sum_{i=0}^{n-1} C_i C_{n-i-1}, \qquad C_0 = 1,
$$ 
а это есть рекуррентное соотношение для чисел Каталана.
\end{sol_exerc}





\begin{sol_exerc}
По заданной триангуляции дерево можно построить следующим образом: поместим в каждый треугольник по вершине, после чего соединим ребрами те вершины, для которых соответствующие треугольники имеют общую сторону. Корнем можно назначить, например, вершину, лежащую в треугольнике, одна из сторон которого совпадает со стороной $(1,2)$ исходного  многоугольника (рис.\ref{fig:triangulation}). Любое поддерево является левым или правым потомком своего родителя в зависимости от того, к какой из сторон треугольника, содержащего родительскую вершину, примыкает треугольник, содержащий текущую вершину (корень поддерева).
\end{sol_exerc}


\begin{figure}[h]
\centering
  \includegraphics[scale=0.8]{pics/triangulation.eps}
\caption{}
\label{fig:triangulation}
\end{figure}


\begin{sol_exerc}
Рассмотрим произвольное рассечение многоугольника, описанное в условии данного упражнения. Назовём корневым многоугольником в нём тот многоугольник, к которому примыкает внешняя сторона $(1,2)$ исходного многоугольника. Корневой многоугольник может быть либо треугольником, либо многоугольником с числом сторон, большим трех. В случае треугольника третья его вершина имеет номер $i$, лежащий в интервале от 3 до $n+1$. Корневой треугольник делит рассечение на две части — два многоугольника с числом вершин $i-1$ и $n-i+2$ (на рис.\ref{fig:dissections},a изображён случай $i = 5$). 

Во втором случае рассмотрим вершину корневого многоугольника с наименьшим номером $i$, отличным от $1$ и $2$  ($i=4$ на рис. \ref{fig:dissections},b). Ребро $(2,i)$ делит рассечение на две части. В одной из них мы можем произвольным образом построить рассечение $(i-1)$-угольника. Во второй части строится рассечение $(n-i+3)$-угольника на вершинах $1,2,i,i+1,\dots,n+1$, в котором обязательно отсутствует ребро $(1,i)$ (пунктирная линия на рисунке). Нетрудно убедиться, что таких рассечений столько же, сколько и произвольных рассечений $(n-i+2)$-угольника. 

Заметим, наконец,  что во втором случае индекс $i$ не может принимать значение $n+1$, так как при этом мы бы получили корневой многоугольник с числом сторон, равным 3.

Проведенные рассуждения позволяют нам записать следующее рекуррентное соотношение для чисел $S_n$:
$$
S_n=\sum_{i=3}^{n+1} S_{i-2}S_{n-i+2} + \sum_{i=3}^{n} S_{i-2}S_{n-i+2}  = S_{n-1} + 2\sum_{i=3}^{n} S_{i-2}S_{n-i+2}; \qquad S_1 = 1.
$$
\end{sol_exerc}


\begin{figure}[h]
\centering
\begin{tabular}[t]{cc}
	\begin{subfigure}[b]{0.45\textwidth}
	\centering
    		\includegraphics[scale=0.8]{pics/dissection1.eps}
 	\caption{}
	\end{subfigure}

&
	\begin{subfigure}[b]{0.45\textwidth}
	\centering
    		\includegraphics[scale=0.8]{pics/dissection2.eps}
 	\caption{}
	\end{subfigure}
\end{tabular}
\caption{Рассечения}
\label{fig:dissections}
\end{figure}


\begin{sol_exerc}
Каждый путь Моцкина длины $n+1$ начинается либо с шага $(1,0)$, либо с шага $(1,1)$. Количество путей, начинающихся с шага $(1,0)$, равно, очевидно, $M_{n}$. Любой путь, начинающийся с шага $(1,1)$ впервые касается оси абсцисс в точке $(i+2,0)$,$ i \in [n-1]$, причем предыдущая точка этого пути обязана быть точкой с координатами $(i+1,1)$. Отрезкам же $[1,i+1]$ и $[i+2, n+1]$ рассматриваемого пути могут соответствовать любые пути Моцкина соответствующего размера. 

Как следствие, рекуррентное соотношение для чисел Моцкина выглядит следующим образом:
$$
M_{n+1} = M_{n} + \sum_{i=0}^{n-1} M_{i} M_{n-i-1}.
$$
\end{sol_exerc}



\begin{sol_exerc}
Заметим, что любой путь Моцкина длины $n$ состоит из $2k$ шагов вида $(1,-1)$ и $(1,1)$, а также из $(n-2k)$ шагов вида $(1,0)$. Выбрать $2k$ позиций для шагов $(1,-1)$ и $(1,1)$ можно $\binom{n}{2k}$ способами. Кроме того, имеется $C_k$ способов построить на этих позициях путь, состоящий только лишь из шагов $(1,-1)$ и $(1,1)$, и не опускающийся ниже оси абсцисс. Действительно, каждому такому пути можно сопоставить правильную скобочную последовательность по следующему простому правилу: шаг вверх открывает скобку, а шаг вниз ее закрывает. Применение правил суммы и произведения завершает доказательство равенства.
\end{sol_exerc}



\begin{sol_exerc}
С комбинаторной точки зрения произведение $\binom{m}{k} \binom{n+m-k}{m}$ описывает количество способов разбить $(n+m-k)$-элементное множество на три блока, имеющие размеры $n-k$, $m-k$, $k$ соответственно. Теперь очевидно, что это за блоки: все $n+m-k$ шагов для заданного пути на плоскости мы разбиваем на три группы —  $(n-k)$ шагов вверх, $(m-k)$ шагов вправо и $k$ диагональных шагов. Так как $k$ может меняться в диапазоне от $0$ до $m$, то суммирование указанного выражения по всем таким $k$ даёт нам в точности число Деланноя.
\end{sol_exerc}


\section{Мультииндексные рекуррентные соотношения}

\myitem Ранее мы встречали многочисленные примеры рекуррентных соотношений, в которых искомые числовые последовательности зависели более чем от одного индекса. Самый известный и простой пример такого рода --- это рекуррентное соотношение для биномиальных коэффициентов (\ref{eq:binom_recur})
$$
\BCf{n}{k}=\BCf{n-1}{k-1}+\BCf{n-1}{k},\qquad k\geq 1,\quad n\geq 1;
$$
$$
\BCf{n}{k}=0\quad \mbox{при} \quad k>n;\qquad \qquad
\BCf{n}{0}=1\quad \forall \,\,n\geq 0.
$$
Аналогичные рекуррентные соотношения встречались у нас и для чисел $\BCCf{n}{k}$ с повторениями (см.формулы (\ref{eq:comb_repet_recur})), и для чисел $S(n,k)$ Стирлинга второго рода (см.формулы (\ref{eq:Num_Stir_2_rod_recur})), и для других важных числовых последовательностей. Задача этого параграфа --- научиться решать такие соотношения, т.е. находить явное выражение искомых чисел как функций параметров $n$ и $k$, с помощью производящих функций.


\myitem Кажется очевидным, что двухпараметрическим числовым последовательностям должны соответствовать
производящие функции, зависящие от двух переменных. Дадим строгие определения.

\begin{defin} (Обыкновенной) производящей функцией для числовой последовательности $a_{n,k}$ называется формальный степенной ряд $f(z,t)\in\C[[z,t]]$ вида
$$
f(z,t)=a_{0,0}+a_{1,0}t+a_{0,1}z+a_{2,0}t^2+a_{1,1}zt+a_{0,2}z^2+a_{3,0}t^3+a_{2,1}zt^2+
a_{1,2}z^2t+a_{0,3}z^3+\ldots+
$$
$$
+a_{n,k}z^kt^n+\ldots=\sum\limits_{n,k=0}^{+\infty}a_{n,k}z^kt^n.
$$
\end{defin}

\begin{defin}  Экспоненциальной производящей функцией для числовой последовательности $a_{n,k}$ называется формальный степенной ряд $F(z,t)\in\C_{ee}[[z,t]]$ вида
$$
FF(z,t)=a_{0,0}+a_{1,0}\dfrac{t}{1!}+a_{0,1}\dfrac{z}{1!}+a_{2,0}\dfrac{t^2}{2!}
+a_{1,1}\dfrac{z}{1!}\dfrac{t}{1!}+a_{0,2}\dfrac{z^2}{2!}+a_{3,0}\dfrac{t^3}{3!}+
a_{2,1}\dfrac{z}{1!}\dfrac{t^2}{2!}+a_{1,2}\dfrac{z^2}{2!}\dfrac{t}{1!}+a_{0,3}\dfrac{z^3}{3!}+
\ldots+
$$
$$+a_{n,k}\dfrac{z^k}{k!}\dfrac{t^n}{n!}+\ldots=
\sum\limits_{n,k=0}^{+\infty}a_{n,k}\dfrac{z^k}{k!}\dfrac{t^n}{n!}.
$$
\end{defin}

Наконец, наряду с этими двумя производящими функциями в комбинаторике широко используется и так называемая полуэкспоненциальная производящая функция, а именно, формальный степенной ряд $F(z,t)\in\C_e[[z,t]]$ вида
$$
F(z,t)=a_{0,0}+a_{1,0}\dfrac{t}{1!}+a_{0,1}z+a_{2,0}\dfrac{t^2}{2!}+a_{1,1}z\dfrac{t}{1!}+
a_{0,2}z^2+a_{3,0}\dfrac{t^3}{3!}+a_{2,1}z\dfrac{t^2}{2!}+a_{1,2}z^2\dfrac{t}{1!}+
a_{0,3}z^3+
\ldots+
$$
$$+a_{n,k}z^k\dfrac{t^n}{n!}+\ldots=
\sum\limits_{n,k=0}^{+\infty}a_{n,k}z^k\dfrac{t^n}{n!}.
$$

Очень часто числовые последовательности $a_{n,k}$ являются треугольными, т.е. обладают свойством $a_{n,k}=0$ при $k>n$. Производящие функции для таких последовательностей можно записать в несколько более простом виде. Так, для полуэкспоненциальных функций имеем
$$
F(z,t)=a_{0,0}+(a_{1,0}+a_{1,1}z)\dfrac{t}{1!}+(a_{2,0}+a_{2,1}z+a_{2,2}z^2)\dfrac{t^2}{2!}+
\ldots+
$$
$$
+(a_{n,0}+a_{n,1}z+\ldots+a_{n,k}z^k+\ldots+a_{n,n}z^n)\dfrac{t^n}{n!}+\ldots=
\sum\limits_{n=0}^{+\infty}P_n(z)\dfrac{t^n}{n!}.
$$


\myitem Перейдем теперь к алгоритмам поиска решений двухпараметрических рекуррентных соотношений с
помощью таких функций. Опишем, как обычно, эти алгоритмы вначале на простейшем примере, а именно, на примере рекуррентного соотношения для биномиальных коэффициентов $\BCf{n}{k}\equiv c_{n,k}$.

\mysubitem Самый простой с идейной точки зрения способ решения двухпараметрического рекуррентного соотношения состоит в том, чтобы сразу построить для соответствующей числовой последовательности обыкновенную производящую функцию, зависящую от двух аргументов. Так, для числовой последовательности $c_{n,k}$, удовлетворяющей рекуррентному соотношению
\begin{equation}
\label{eq:req_seq_c_nk}
c_{n+1,k+1}=c_{n,k}+c_{n,k+1}
\end{equation}
и начальным условиям
\begin{equation}
\label{eq:req_seq_c_nk_beg}
c_{n,0}=1\quad \forall \,n\geq 0,\qquad \qquad c_{n,k}=0\quad \forall\, k>n,
\end{equation}
можно сразу ввести обыкновенную производящую функцию вида
$$
w(z,t)=c_{0,0}+c_{0,1}t+c_{1,1}zt+c_{0,2}t^2+c_{1,2}zt^2+c_{2,2}z^2t^2+\ldots=
\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^nc_{n,k}z^kt^n.
$$
Заметим, что в этой форме записи производящей функции уже учтено второе начальное условие (\ref{eq:req_seq_c_nk_beg}), а именно, тот факт, что $c_{n,k}=0$ при $k>n$.

Домножая теперь рекуррентное соотношение (\ref{eq:req_seq_c_nk}) на $z^{k+1}t^{n+1}$ и суммируя его по всем возможным значениям $n$ и $k$, получаем равенство
$$
\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^nc_{n+1,k+1}z^{k+1}t^{n+1}=
\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^nc_{n,k}z^{k+1}t^{n+1}+
\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^nc_{n,k+1}z^{k+1}t^{n+1}.
$$
Рассмотрим вначале сумму, стоящую в левой части полученного равенства. Записывая ее в явном виде, заметим, что
$$
c_{1,1}zt+c_{2,1}zt^2+c_{2,2}z^2t^2+c_{3,1}zt^3+c_{3,2}z^2t^3+c_{3,3}z^3t^3+\ldots=
w(z,t)-c_{0,0}-c_{1,0}t-c_{2,0}t^2-\ldots
$$
Из начальных условий мы знаем, что все $c_{0,n}=1$. Поэтому последнее выражение можно переписать
так:
$$
\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^nc_{n+1,k+1}z^{k+1}t^{n+1}=w(z,t)-1-t-t^2-\ldots=
w(z,t)-\dfrac{1}{1-t}.
$$

Разберемся теперь с правой частью полученного выше равенства. Очевидно, что
$$
\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^nc_{n,k}z^{k+1}t^{n+1}=
zt\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^nc_{n,k}z^kt^n=ztw(z,t).
$$
Второе же слагаемое в правой части расписывается так:
$$
\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^nc_{n,k+1}z^{k+1}t^{n+1}=
t(c_{0,1}z+c_{1,1}zt+c_{2,1}zt^2+c_{2,2}z^2t^2+c_{3,1}zt^3+c_{3,2}z^2t^3+c_{3,3}z^3t^3+\ldots).
$$
Первое слагаемое в скобке равно нулю, а оставшиеся слагаемые, как уже было показано ранее, сворачиваются в выражение вида
$$
w(z,t)-\dfrac{1}{1-t}.
$$
Таким образом, мы из рекуррентного соотношения (\ref{eq:req_seq_c_nk}) и начальных условий (\ref{eq:req_seq_c_nk_beg}) получаем следующее линейное уравнение на производящую функцию $w(z,t)$:
$$
w(z,t)-\dfrac{1}{1-t}=ztw(z,t)+tw(z,t)-\dfrac{t}{1-t}\qquad \Longrightarrow \qquad
w(z,t)[1-zt-t]=1.
$$
Поэтому $w(z,t)$ представляет собой рациональную функцию переменных $z$ и $t$, которая раскладывается в формальный степенной ряд вида
$$
w(z,t)=\dfrac{1}{1-t(1+z)}=\sum\limits_{n=0}^{+\infty}(1+z)^nt^n=
\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^n\BCf{n}{k}z^kt^n.
$$

\mysubitem Иногда удобнее, однако, ту же задачу решать поэтапно. Именно, на первом этапе, считая $n$ параметром, можно пытаться получить рекуррентное соотношение на производящие функции $P_n(z)$. В силу условия $c_{n,k}=0$ при $k>n$ эти функции представляют собой полиномы степени $n$. Второй этап состоит в решении рекуррентного соотношения на $P_n(z)$ с помощью производящих функций вида
$$
w(z,t)=\sum\limits_{n=0}^{+\infty}P_n(z)t^n\qquad \text{или}\qquad
w(z,t)=\sum\limits_{n=0}^{+\infty}P_n(z)\dfrac{t^n}{n!}.
$$

Продемонстрируем этот подход для числовой последовательности $c_{n,k}$, описывающейся рекуррентным соотношением (\ref{eq:req_seq_c_nk}). Введем вначале полиномы 
$$
P_n(z)=c_{n,0}+c_{n,1}z+c_{n,2}z^2+\ldots+c_{n,n}z^n.
$$
Для получения уравнения на $P_n(z)$ домножим (\ref{eq:req_seq_c_nk}) на $z^{k+1}$ и просуммируем его по $k$ от нуля до $n$:
$$
\sum\limits_{k=0}^nc_{n+1,k+1}z^{k+1}=\sum\limits_{k=0}^nc_{n,k}z^{k+1}+
\sum\limits_{k=0}^nc_{n,k+1}z^{k+1}.
$$
В левой части этого равенства имеем полином вида
$$
c_{n+1,1}z+c_{n+1,2}z^2+\ldots+c_{n+1,n+1}z^{n+1}=P_{n+1}(z)-c_{n+1,0}=P_{n+1}(z)-1.
$$
Правую часть того же равенства можно переписать так:
$$
\sum\limits_{k=0}^nc_{n,k}z^{k+1}+\sum\limits_{k=0}^nc_{n,k+1}z^{k+1}=z\,P_n(z)+P_n(z)-1.
$$
Таким образом, полиномы $P_n(z)$ удовлетворяют рекуррентному соотношению 
\begin{equation}
\label{eq:P_n_req_eq}
P_{n+1}(z)=(1+z)\,P_n(z).
\end{equation}

В данном частном случае рекуррентное соотношение (\ref{eq:P_n_req_eq}) на $P_n(z)$ решается легко: видно, что  $P_n(z)=(1+z)^n$, откуда сразу следует, что $c_{n,k}=\BCf{n}{k}$. В более сложных случаях нам следует перейти ко второму этапу. Именно, следует домножить рекуррентное соотношение для $P_n(z)$ на $t^n$ или на $t^n/n!$, и получить затем уравнение на производящие функции $w(z,t)$ или $W(z,t)$ двух аргументов.

Так, домножая в нашем примере уравнение (\ref{eq:P_n_req_eq}) на $t^{n+1}$ и суммируя по $n$, имеем
$$
\sum\limits_{n=0}^{+\infty}P_{n+1}(z)t^{n+1}=(1+z)t\sum\limits_{n=0}^{+\infty}P_{n}(z)t^{n}\qquad
$$
В левой части этого равенства стоит выражение, равное
$$
w(z,t)-P_0(z)=w(z,t)-1.
$$
Правая часть того же равенства, очевидно, равна $(1+z)tw(z,t)$. Следовательно,
$$
w(z,t)=\dfrac{1}{1-t(1+z)}
$$
в полном согласии с первым методом решения задачи.

\mysubitem Для получения полуэкспоненциальной производящей функции $W(z,t)$ домножим (\ref{eq:P_n_req_eq}) на $t^n/n!$ и просуммируем результат по $n$:
$$
\sum\limits_{n=0}^{+\infty}P_{n+1}(z)\dfrac{t^{n}}{n!}=
(1+z)\sum\limits_{n=0}^{+\infty}P_{n}(z)\dfrac{t^{n}}{n!}.
$$
Левая часть этого равенства представляет собой производную функции $W(z,t)$ по $t$. Правая же его часть равна, очевидно, $(1+z)\,W(z,t)$. Следовательно, при таком подходе мы получаем дифференциальное уравнение
$$
\pd{W}{t}=(1+z)\,W
$$
на функцию $W(z,t)$ по переменной $t$, зависящее от $z$ как от параметра. Добавляя к нему начальное условие $W(z,0)=P_0(z)=c_{0,0}=1$, получаем задачу Коши, решение которой, очевидно, имеет вид
$$
W(z,t)=e^{t(1+z)}.
$$
Разложение этого решения в малой окрестности точки $t=0$ дает нам искомый результат:
$$
W(z,t)=\sum\limits_{n=0}^{+\infty}(1+z)^n\dfrac{t^n}{n!}.
$$




\section*{Упражнения}

\begin{exerc}
Используя рекуррентные соотношения (\ref{eq:Num_Stir_2_rod_recur}), получить полуэкспоненциальную производящую функцию $W(z,t)$ для чисел Стирлинга второго рода (\ref{eq:Num_Stir_2_rod}). 
\end{exerc}

\begin{exerc}
Одной из комбинаторных интерпретаций чисел Каталана $C_n$, описанных в предыдущем параграфе, было количество путей на плоскости $(n,k)$, исходящих из начала координат, оканчивающихся в точке с координатами $(2n,0)$, состоящих из отрезков $(1,1)$ и $(1,-1)$, и никогда не опускающихся ниже оси абсцисс. Рассмотреть обобщение этой задачи, а именно, найти рекуррентные соотношения, описывающие количество $d_{n,k}$ таких путей, оканчивающихся в некоторой точке $(n,k)$ (см.рис.).
\end{exerc}

\begin{exerc}
Найти обыкновенную производящую функцию
$$
d(z,t)=\sum\limits_{n=0}^{+\infty}\sum\limits_{k=0}^n d_{n,k}z^kt^n=\sum\limits_{n=0}^{+\infty}P_n(z)t^n,\qquad 
P_n(z)=\sum\limits_{k=0}^n d_{n,k}z^k.
$$
для описанных в предыдущем упражнении чисел $d_{n,k}$, зная производящую функцию для чисел Каталана. 
\end{exerc}

\begin{exerc}
Можно ли найти обыкновенную производящую функцию из предыдущего упражнения, не зная априори производящей функции, описывающей количество путей, заканчивающихся на оси абсцисс?
\end{exerc}

\begin{exerc} \label{exerc:Q_n}
Рассмотрим функцию $1/\sin(\theta)$. Используя обозначение $x=\cos(\theta)$, ее можно переписать так:
$$
f(x)=\dfrac{1}{\sqrt{1-x^2}}.
$$
Будем дифференцировать $f(x)$ по $x$. Ясно, что $n$-ю производную этой функции можно представить в виде
\begin{equation}
\label{exerc:f_Q_recurr}
f^{(n)}(x)=\dfrac{Q_n(x)}{(1-x^2)^{n+1/2}},
\end{equation}
где $Q_n(x)$ есть некоторой полином от $x$ степени $n$. Доказать, что для этого полинома справедливо рекуррентное соотношение вида
\begin{equation}
\label{exerc:Q_recurr}
Q_{n+1}(x)=(1-x^2) Q'_n(x)+(2n+1)x\,Q_n(x),\qquad Q_0=1.
\end{equation}
\end{exerc} 

\begin{exerc}
Доказать, что полуэкспоненциальная производящая функция вида
\begin{equation}
\label{exerc:gen_funct_series_Q_n}
w(x,t)=\sum\limits_{n=0}^{+\infty}Q_n(x)\dfrac{t^n}{n!}
\end{equation}
для полиномов, описанных в упражнении \ref{exerc:Q_n}, равна
\begin{equation}
\label{exerc:gen_funct_Q_n}
w(x,t)=\dfrac{1}{\sqrt{(1-t(1+x))(1+t(1-x))}}.
\end{equation}
\end{exerc}

\begin{exerc}
Вывести для описанных в упражнении \ref{exerc:Q_n} полиномов $Q_n(x)$ трехчленное рекуррентное соотношение вида
$$
Q_{n+1}(x)=(2n+1)\,x\,Q_n(x)+n^2(1-x^2)Q_{n-1}(x),\qquad Q_0(x)=1,\qquad  Q_1(x)=x,
$$
используя найденную в предыдущем упражнении производящую функцию (\ref{exerc:gen_funct_Q_n}). 
\end{exerc}

\begin{exerc}
Используя бином Ньютона, получить явные формулы для описанных в упражнении \ref{exerc:Q_n} полиномов $Q_n(x)$.
\end{exerc}

\begin{exerc}
Используя рекуррентные соотношения (\ref{exerc:Q_recurr}) для описанных в упражнении \ref{exerc:Q_n} полиномов $Q_n(x)$, вывести следующие рекуррентные соотношения для коэффициентов $a_{n,k}$ этих полиномов:
$$
a_{n+1,k+1}=(2n+1-k)\,a_{n,k}+(k+2)\,a_{n,k+2},\qquad n=2,3,\ldots,\quad k=1,\ldots,n-1;
$$
$$
a_{n,n}=n!,\qquad a_{2i,0}=((2i-1)!!)^2=(1\cdot 3\cdot 5\cdot \ldots\cdot (2i-1))^2,\qquad i=1,2,\ldots,\qquad a_{0,0}=1.
$$
Построить с использованием этих соотношений на плоскости $(n,k)$ треугольник, задающий комбинаторную интерпретацию чисел $a_{n,k}$ как взвешенных путей, идущих из начала координат в точку с координатами $(n,k)$.  
\end{exerc}



\section*{Решения упражнений}

\begin{sol_exerc} 
Домножим рекуррентные соотношения 
$$
S(n+1,k+1)=S(n,k)+(k+1)\cdot S(n,k+1),\qquad k=1,\ldots,n+1
$$ 
на $z^{k+1}$ и просуммируем результат по $k$ от нуля до $n$:
$$
\sum\limits_{k=0}^nS_{n+1,k+1}z^{k+1}=\sum\limits_{k=0}^nS_{n,k}z^{k+1}+
\sum\limits_{k=0}^n(k+1)\cdot S_{n,k+1}z^{k+1}.
$$
С учетом граничных условий
$$
S(n,0)=0\quad\forall \,\,n>0;\qquad S(n,k)=0\quad\forall \,\,k>n.
$$
получается следующее рекуррентное соотношение для полиномов
$$
P_n(z)=\sum\limits_{k=0}^nS_{n,k}z^k:\qquad 
P_{n+1}(z)=z\cdot P_n(z)+z\cdot P'_n(z).
$$
Начальное условие $S(0,0)=1$ дает $P_0(z)=1$.

Для построения полуэкспоненциальной функции домножим теперь рекуррентное соотношение для $P_n(z)$ на $t^n/n!$ и просуммируем по $n$ от нуля до $+\infty$. В результате получим следующее уравнение в частных производных первого порядка:
$$
\pd{W}{t}=z\cdot W+z\cdot \pd{W}{z}. 
$$
Запишем для этого уравнения характеристическую систему \cite{Philippov}:
$$
\dfrac{dt}{1}=\dfrac{-dz}{z}=\dfrac{dW}{z\,W},
$$
Эта система имеет такие два первых интеграла:
$$
t+\ln z=C_1,\qquad z+\ln W=C_2.
$$
Следовательно, общее решение уравнения в частных производных может быть записано так:
$$
W(z,t)=\exp(-z)\,\Phi(t+\ln z),
$$
где $\Phi(x)$ --- произвольная функция своего аргумента $x$. Для определения этой функции подставим в полученное выше равенство значение $t=0$ и учтем, что $W(z,0)=P_0(z)=1$. Поэтому
$$
1=\exp(-z)\,\Phi(\ln z)\qquad\Longrightarrow\qquad \Phi(z)=\exp(\exp(z)),
$$
а искомая функция $W(z,t)$ имеет вид
$$
W(z,t)=\exp(-z)\,\exp(\exp(t+\ln z))=\exp(-z)\,\exp(z\,\exp(t))=\exp(z(\exp(t)-1)).
$$
\end{sol_exerc} 

\begin{sol_exerc}
Достаточно очевидно, что $d_{n,k}=0$ для всех $k>n$ и для всех $k<0$. Далее, понятно, что количество путей, приходящих в точку $(n+1,k)$ для $k=0,\ldots,n+1$ равно количеству путей, приходящих в точку с координатами $(n,k-1)$, плюс количество путей, оканчивающихся в точке с координатами $(n,k+1)$. Следовательно, числа $d_{n,k}$ удовлетворяют следующим рекуррентным соотношениям:
\begin{equation}
\label{eq:req_eq_Dick_triangle}
d_{n+1,k}=d_{n,k-1}+d_{n,k+1},\qquad k=0,\ldots,n+1;
\end{equation}
$$
d_{0,0}=1;\qquad d_{n,k}=0\quad\text{для всех $k<0$ и $k>n.$}
$$
\end{sol_exerc}

\begin{sol_exerc}
Домножим (\ref{eq:req_eq_Dick_triangle}) на $z^k$ и просуммируем результат по $k$ от нуля до $(n+1)$. В результате получим следующее рекуррентное соотношение на полиномы $P_n(z)$:
\begin{equation}
\label{eq:req_eq_Dick_triangle_polyn}
P_{n+1}(z)=z\cdot P_n(z)+\dfrac{P_n(z)-P_n(0)}{z}.
\end{equation}
Домножая теперь (\ref{eq:req_eq_Dick_triangle_polyn}) на $t^{n+1}$ и суммируя по $t$ от $0$ до $+\infty$, получим уравнение на функцию $d(z,t)$ вида
\begin{equation}
\label{eq:eq_Dick_triangle_gen_funct}
d(z,t)-P_0(z)=t\cdot z\cdot d(z,t)+t\cdot \dfrac{d(z,t)-d(0,t)}{z}.
\end{equation}
Для получения окончательного ответа остается заметить, что $P_0(z)=d_{0,0}=1$, а $d(0,t)$ есть производящая функция, описывающая количество путей, заканчивающихся в точке с координатами $(2n,0)$, то есть производящая функция для чисел Каталана (\ref{eq:gen_funct_num_Cat}):
$$
d(0,t)=\dfrac{1-\sqrt{1-4t^2}}{2t^2}=1+t^2+2t^4+5t^6+=\sum\limits_{n=0}^{+\infty}C_{n}t^{2n}.
$$
Разрешая теперь уравнение (\ref{eq:eq_Dick_triangle_gen_funct}) относительно функции $d(z,t)$, можно окончательно записать следующее выражение для искомой производящей функции:
$$
d(z,t)=\dfrac{1-\sqrt{1-4t^2}-2tz}{2t(tz^2+t-z)}.
$$
\end{sol_exerc}

\begin{sol_exerc}
Да, это возможно, например, с помощью следующих эвристических рассуждений \cite{Knuth_Art_1}. Разрешим уравнение (\ref{eq:eq_Dick_triangle_gen_funct}) относительно искомой функции $d(z,t)$:
\begin{equation}
\label{eq:eq_Dick_triangle_gen_funct_expl}
d(z,t)=\dfrac{t\,d(0,t)-z}{t(z^2+1)-z}.
\end{equation}
Разложим знаменатель выражения, стоящего в правой части (\ref{eq:eq_Dick_triangle_gen_funct_expl}):
$$
t(z^2+1)-z=t(z-r_1(t))(z-r_2(t)),\qquad r_1(t)=\dfrac{1+\sqrt{1-4t^2}}{2t},\qquad r_2(t)=\dfrac{1-\sqrt{1-4t^2}}{2t}.
$$ 
Заметим, прежде всего, что $r_2(z)$, в отличие от $r_1(z)$, является аналитической функцией в окрестности точки $z=0$. Если мы теперь выберем $z=r_2(t)$, то, очевидно, знаменатель стоящего в правой части (\ref{eq:eq_Dick_triangle_gen_funct_expl}) выражения обратится в ноль. Для того, чтобы функция $F(t,u)$ оставалась корректно определенной, нам необходимо потребовать, чтобы и числитель при таком выборе $z$ обращался в ноль. Иными словами, нам нужно считать, что
$$
t\,d(0,t)-r_2(t)=0\qquad \Longrightarrow \qquad d(0,t)=\dfrac{1-\sqrt{1-4t^2}}{2t^2}.
$$ 
Описанный выше подход получил в литературе название метода ядра \cite{Polyn_eq}. 
\end{sol_exerc}

\begin{sol_exerc} 
Продифференцируем еще один раз равенство (\ref{exerc:f_Q_recurr}) по $x$:
$$
f^{(n+1)}(x)=\dfrac{Q'_n(x)}{(1-x^2)^{n+1/2}}+\dfrac{x\,Q_n(x)\,(2n+1)}{(1-x^2)^{n+3/2}}.
$$ 
С другой стороны, по определению полинома $Q_n(x)$, 
$$
f^{(n+1)}(x)=\dfrac{Q_{n+1}(x)}{(1-x^2)^{n+3/2}}.
$$
Сравнивая полученные равенства, получаем искомое рекуррентное соотношение (\ref{exerc:Q_recurr}) на полиномы $Q_n(x)$.
\end{sol_exerc}

\begin{sol_exerc}
Домножим (\ref{exerc:Q_recurr}) на $t^n/n!$ и просуммируем полученное выражение по $n$ от $0$ до $+\infty$:
$$
\sum\limits_{n=0}^{+\infty}Q_{n+1}(x)\dfrac{t^n}{n!}=(1-x^2)\sum\limits_{n=0}^{+\infty}Q'_n(x)\dfrac{t^n}{n!}+
2x\sum\limits_{n=1}^{+\infty}Q_n(x)\dfrac{t^n}{(n-1)!}+x\sum\limits_{n=0}^{+\infty}Q_n(x)\dfrac{t^n}{n!}.
$$
Переписывая последнее равенство в терминах функции $w(x,t)$, имеем следующее уравнение в частных производных первого порядка относительно искомой производящей функции: 
\begin{equation}
\label{eq:gen_funct_pd}
\pd{w}{t}=(1-x^2)\pd{w}{x}+2xt\pd{w}{t}+x\,w.
\end{equation}
Характеристическая система уравнений
$$
\dfrac{dx}{1-x^2}=\dfrac{dt}{2xt-1}=\dfrac{dw}{x\,w}
$$
сводится к системе обыкновенных дифференциальных уравнений вида
$$
\od{t}{x}=\dfrac{2xt-1}{1-x^2},\qquad \od{w}{x}=\dfrac{x\,w}{1-x^2},
$$
которая имеет следующие первые интегралы:
$$
x+t(1-x^2)=C_1,\qquad w(1-x^2)^{-1/2}=C_2.
$$
Это позволяет записать общее решение уравнения (\ref{eq:gen_funct_pd}):
$$
w(x,t)=\sqrt{1-x^2}f(x+t(1-x^2)).
$$
Так как при $t=0$ производящая функция $w(x,0)=Q_0(x)=1$, то
$$
f(x)=\dfrac{1}{\sqrt{1-x^2}}.
$$
Следовательно, решение уравнения (\ref{eq:gen_funct_pd}) с начальными условиями вида $w(x,0)=1$ имеет вид
$$
w(x,t)=\dfrac{\sqrt{1-x^2}}{\sqrt{1-(x+t(1-x^2))^2}}.
$$
Для получения искомого выражения (\ref{exerc:gen_funct_Q_n}) для производящей функции $w(x,t)$ осталось заметить, что
$$
1-(x+t(1-x^2))^2=(1-x-t(1-x^2))(1+x+t(1-x^2))=(1-x)(1-t(1+x))(1+x)(1+t(1-x)).
$$
\end{sol_exerc}


\begin{sol_exerc}
Продифференцируем (\ref{exerc:gen_funct_Q_n}) по t:
$$
\pd{w}{t}=(1+2k)\dfrac{w\,[x+t(1-x^2)]}{(1-t(1+x))(1+t(1-x))}.
$$
Следовательно, производящая функция удовлетворяет соотношению вида
$$
(1-t(1+x))(1+t(1-x))\pd{w}{t}=(1+2k)\,w\,[x+t(1-x^2)].
$$
Подставляя в это равенство ряд (\ref{exerc:gen_funct_series_Q_n}) и приравнивая коэффициенты при одинаковых степенях $t^n/n!$, получаем искомое трехчленное рекуррентное соотношение.
\end{sol_exerc}

\begin{sol_exerc} Используя формулу (\ref{eq:Bin_Newt_tot}), перепишем каждый из двух сомножителей производящей функции (\ref{exerc:gen_funct_Q_n}) в виде ряда по степеням $t^n$:
$$
\dfrac{1}{\sqrt{1-t(1+x)}}=\sum\limits_{n=0}^{+\infty}\BCf{-1/2}{n}(-1)^n(1+x)^nt^n=
$$
$$
=1+\sum\limits_{n=1}^{+\infty}\dfrac{1\cdot 3\cdot 5\cdot\ldots\cdot(2n-1)}{2^n n!}(1+x)^nt^n=
$$
$$
=1+\sum\limits_{n=1}^{+\infty}\dfrac{1\cdot 2\cdot 3\cdot\ldots\cdot(2n-1)(2n)}{4^n(n!)^2}(1+x)^nt^n=
\sum\limits_{n=0}^{+\infty}\BCf{2n}{n}\dfrac{(1+x)^n}{4^n}t^n.
$$
Аналогично,
$$
\dfrac{1}{\sqrt{1+t(1-x)}}=1+
\sum\limits_{n=1}^{+\infty}\dfrac{(-1/2)(-1/2-1)\ldots(-1/2-n+1)}{n!}(1-x)^nt^n=
$$
$$
=1+\sum\limits_{n=1}^{+\infty}\dfrac{1\cdot 3\cdot 5\cdot\ldots\cdot(2n-1)}{2^n n!}(-1)^n(1-x)^nt^n=
$$
$$
=1+\sum\limits_{n=1}^{+\infty}\dfrac{1\cdot 2\cdot 3\cdot\ldots\cdot(2n-1)(2n)}{4^n(n!)^2}(-1)^n(1-x)^nt^n=
\sum\limits_{n=0}^{+\infty}\BCf{2n}{n}\dfrac{(-1)^n(1+x)^n}{4^n}t^n.
$$
Перемножая последние два выражения, получаем
$$
Q_n(x)=\dfrac{n!}{4^n}\sum\limits_{i=0}^n\BCf{2i}{i}\BCf{2n-2i}{n-i}(-1)^{n-i}(1+x)^i(1-x)^{n-i}.
$$
\end{sol_exerc}

\begin{sol_exerc}
Используя представление полиномов $Q_n(x)$ в виде
$$
Q_n(x)=\sum\limits_{k=0}^na_{n,k}x^k,
$$
рекуррентное соотношение (\ref{exerc:Q_recurr}) можно переписать следующим образом:
$$
\sum\limits_{k=0}^{n+1}a_{n+1,k}x^k=(1-x^2)\sum\limits_{k=1}^nk\,a_{n,k}x^{k-1}+(2n+1)\sum\limits_{k=0}^na_{n,k}x^{k+1}.
$$
Приравнивая в последнем равенстве коэффициенты при $x^{k+1}$, мы и получим искомое рекуррентное соотношение для чисел $a_{n,k}$. 

Треугольник на плоскости $(n,k)$ для этих чисел показан на рис.
\end{sol_exerc}


\section{Понятие дискретной вероятности}

\myitem Многие задачи элементарной комбинаторики часто формулируются на языке подсчета вероятностей наступления тех или иных случайных событий. Цель настоящего параграфа --- изложить основные понятия элементарной теории вероятностей, а также показать связь данной науки с элементарной комбинаторикой.

\mysubitem Начнем, как всегда, с самых простых, базовых понятий теории вероятности. 

Под случайным экспериментом будем понимать математическую модель некоторого реального эксперимента, результат которого невозможно точно предсказать. Простейшим и наиболее хрестоматийным примером случайного эксперимента является подбрасывание идеальной монетки. В результате любого такого эксперимента у нас обязательно выпадает или орел, или решка (на ребро идеальная монетка упасть не может). Заранее предсказать, что именно выпадет, мы не можем. Другим простейшим примером случайного эксперимента является подбрасывание игральной кости, результатом которого можно считать выпадение одного из шести чисел, нанесенных на грани куба.

\mysubitem Любой результат $\omega$ случайного эксперимента называется \emph{элементарным событием} или \emph{исходом}. Множество всех возможных исходов обозначим через $\Omega$. Далее мы всегда будем считать, что множество $\Omega$ конечно или счетно. 

Случайным событием или просто \emph{событием} $A$ называется любое подмножество множества $\Omega$. Так, в примере с подбрасыванием игральной кости событиями являются, например, выпадение четного числа или выпадение числа, меньшего тройки. 

Говорят, что в результате случайного эксперимента \emph{произошло событие $A$}, если элементарный исход эксперимента является элементом множества $A$. Так как один и тот же исход может быть элементом нескольких разных событий, то в результате одного и того же случайного эксперимента возможно появление нескольких случайных событий. \emph{Исход же любого случайного эксперимента может быть только один.} 

Так, в примере с игральной костью элементарный исход --- это выпадение конкретного числа, например, двойки. Этот элементарный исход, однако, отвечает появлению сразу двух описанных выше событий --- события $A_1$, описывающего выпадение четного числа, и события $A_2$, соответствующего выпадению числа, меньшего тройки.

\mysubitem Предположим теперь, что у нас для заданного случайного эксперимента имеется некоторый набор $\mathcal A_0$ событий. С помощью теоретико-множественных операций объединения, пересечения и дополнения можно из этого набора $\mathcal A_0$ построить некоторую новую, более полную систему множеств, также являющихся событиями. Присоединяя к этой системе так называемое невозможное $(A=\emptyset)$ и достоверное $(A=\Omega)$ события, мы получаем систему множеств $\mathcal A$, называемую \emph{алгеброй событий,} то есть такую систему подмножеств множества исходов $\Omega$, что, во-первых, само $\Omega\in \mathcal A$, и во-вторых, для любой пары $A,B\in\mathcal A$ их объединение, пересечение и дополнение также принадлежат $\mathcal A$. 

Как правило, в качестве  $\mathcal A_0$ выбирают некоторый набор подмножеств, образующий разбиение множества $\Omega$. В этом случае $\mathcal A$ называется алгеброй, порожденной данным разбиением $\mathcal A_0$. 

В случае конечного множества $\Omega$ в качестве $\mathcal A$ чаще всего выбирается множество $2^{\Omega}$ всех подмножеств данного множества $\Omega$. 

\mysubitem Припишем теперь любому элементарному событию $\omega\in\Omega$ некоторое вещественное число $\Pr(\omega)$ из диапазона $[0,1]$. Это отображение $\Pr:\Omega\to\R_+$ называется \emph{вероятностью,} если для него выполняется следующее условие нормировки:
$$
\sum\limits_{\omega\in\Omega}\Pr(\omega)=1.
$$

Зная вероятность $\Pr(\omega)$ любого элементарного исхода, можно по формуле
\begin{equation}
\label{eq:def_probab}
\Pr(A)=\sum\limits_{\omega\in A}\Pr(\omega)
\end{equation}
определить вероятность случайного события $A$. Иными словами, мы с помощью этой формулы можем продолжить отображение $\Pr$ на все элементы $A$ заданной алгебры событий $\mathcal A$ и считать, что функция $\Pr$ задана не на $\Omega$, а на некоторой алгебре событий $\mathcal A$. 

Зафиксируем теперь некоторую алгебру событий $\mathcal A$. Из определения (\ref{eq:def_probab}) сразу же вытекают следующие простейшие свойства вероятности:
$$
\Pr(\emptyset)=0,\qquad \Pr(\Omega)=1;
$$
$$
\Pr(A\cup B)=\Pr(A)+\Pr(B)-\Pr(A\cap B)\qquad \forall\,\,A,B\in \mathcal A.
$$

События называются \emph{несовместными,} если $A\cap B=\emptyset$. Для таких событий 
\begin{equation}
\label{eq:sum_prob_ind}
\Pr(A\cup B)=\Pr(A)+\Pr(B).
\end{equation}
Следствием формулы (\ref{eq:sum_prob_ind}) является следующее полезное равенство:
\begin{equation}
\label{eq:sum_prob_A_bar_A}
\Pr(\bar{A})=1-\Pr(A), \qquad \text{где}\qquad \bar{A}=\Omega\setminus A.
\end{equation}

Формулы (\ref{eq:sum_prob_ind}) и (\ref{eq:sum_prob_A_bar_A}) легко обобщаются на случай набора $\{A_1,A_2,\ldots,A_n\}$ несовместных событий, а также на случай набора $\mathcal A_0=\{A_1,A_2,\ldots,A_n\}$ подмножеств, образующих разбиение множества $\Omega$. В первом случае имеем равенство
\begin{equation}
\label{eq:sum_prob}
\Pr(A_1\cup A_2\cup\ldots\cup A_n)=\Pr(A_1)+\Pr(A_2)+\ldots+\Pr(A_n),
\end{equation}
называемое \emph{формулой сложения вероятностей несовместных событий.} Во втором случае получаем равенство
$$
\Pr(A_1)+\Pr(A_2)+\ldots+\Pr(A_n)=1.
$$
Набор $\mathcal A_0=\{A_1,A_2,\ldots,A_n\}$ называется при этом \emph{полной группой несовместных событий.}

\mysubitem Приведенное в предыдущем пункте определение вероятности годится только лишь для случая конечного или счетного множества $\Omega$. В случае несчетного $\Omega$ вероятность любого элементарного исхода $\omega$, как правило, равняется нулю. Как следствие, формула (\ref{eq:def_probab}) перестает работать. Поэтому в случае несчетного множества $\Omega$ вероятность $\Pr$ определяется не как функция на множестве событий $\Omega$, а сразу как функция на некоторой алгебре событий $\mathcal A$. При таком подходе равенства $\Pr(\Omega)=1$ и (\ref{eq:sum_prob}) становятся аксиомами теории вероятности.  

Иными словами, в дискретном случае мы можем ограничиться множеством $\Omega$ элементарных событий и заданной на нем функцией $\Pr:\Omega\to[0,1]$, удовлетворяющей условию нормировки. В непрерывном же случае нам необходимо рассматривать тройку $(\Omega,\mathcal A,\Pr)$, где $\Omega$ --- множество исходов, $\mathcal A$ --- некоторая алгебра подмножеств $\Omega$, а $\Pr$ --- заданная на $\mathcal A$ вероятность. При этом говорят, что тройка $(\Omega,\mathcal A,\Pr)$ определяет \emph{вероятностную модель} или \emph{вероятностное пространство} некоторого случайного эксперимента с множеством исходов $\Omega$ и алгеброй событий $\mathcal A$. 

Как мы уже сказали, мы в данном курсе будем рассматривать только дискретную вероятность. Однако для единообразия мы все же будем и в дискретном случае использовать тройку $(\Omega,\mathcal A,\Pr)$ для описания случайных экспериментов.

\begin{examp}
Рассмотрим случайный эксперимент с однократным подбрасыванием монетки. Его можно описать, задав пространство
элементарных исходов 
$$
\Omega=\{\text{решка},\text{орел}\}
$$
и введя на нем вероятность $\Pr:\Omega\to [0,1]$ по формулам
$$
\Pr(\{\text{решка}\})=p,\qquad \Pr(\{\text{орел}\})=q, 
$$
где $p$, $q$ --- вещественные положительные числа, такие, что $p+q=1$. Этот же случайный эксперимент можно описать чуть более сложно, рассмотрев вероятностное пространство вида $(\Omega_1,\mathcal A_1,\Pr_1),$ в котором
\begin{equation}
\label{eq:prob_space_coin_1}
\Omega_1=\{\text{решка},\text{орел}\},\qquad
 \mathcal A_1=2^{\Omega_1}=\{\emptyset,\{\text{решка}\},\{\text{орел}\},\{\text{орел или решка}\}\},
\end{equation}
а вероятность $\Pr_1$ на $\mathcal A_1$ описывается соотношениями
\begin{equation}
\label{eq:prob_space_coin_2}
\Pr_1(\emptyset)=0,\qquad \Pr_1(\{\text{решка}\})=p,\qquad \Pr_1(\{\text{орел}\})=q,\qquad \Pr_1(\{\text{орел или решка}\})=1.
\end{equation}
\end{examp}

\mysubitem Вообще говоря, вероятности элементарных событий можно определять достаточно произвольно. Так, если мы считаем монетку сделанной идеально, то вероятность $q$ выпадения орла совпадает с вероятностью $p$ выпадения решки и равна одной второй. В случае же монетки со смещенным центром тяжести вероятность этих элементарных событий может различаться. Так, ничто не мешает нам, например, определить $p=1/4$, а $q=3/4$. 

Однако на практике все же часто удобно считать, что все различные элементарные события являются равновероятными. В этом случае для любого $\omega\in\Omega$
$$
\Pr(\omega)=\dfrac{1}{|\Omega|},\qquad \text{и, как следствие,}\qquad \Pr(A)=\dfrac{|A|}{|\Omega|}.
$$
Такой способ задания вероятности называется классическим. В этом случае подсчет вероятности $\Pr(A)$ события $A$ сводится к подсчету количества исходов, к этому событию приводящих. Иными словами, в этом случае задача становится чисто комбинаторной. 

\begin{examp} Вернемся к одной из классических урновых схем, а именно, к задаче о подсчете упорядоченных выборок с повторениями. Переформулируем эту задачу на языке дискретной вероятности. 

Пусть в урне имеется $n$ различимых предметов. Будем поочередно вытаскивать $k$ предметов, записывать, какой из предметов и в каком порядке мы вытащили, а затем возвращать каждый предмет обратно в урну. Данная последовательность действий представляет собой случайный эксперимент, элементарным исходом которого является упорядоченный набор $(a_1,a_2,\ldots,a_k)$, $a_i\in X$ для любого $i=1,\ldots,n$. Множество $\Omega$ всех возможных исходов выглядит в этом случае так: 
$$
\Omega=\{\omega:\,\,\omega=(a_1,a_2,\ldots,a_k),\quad a_i\in X\}.
$$
Считая, что любые элементарные исходы данного случайного эксперимента являются равновероятными, мы получаем следующую вероятность любого элементарного исхода в этом эксперименте:
$$
\Pr(\omega)=\dfrac{1}{|\Omega|}=\dfrac{1}{n^k}.
$$
Рассмотрим теперь событие $A$, заключающееся в отсутствии повторений элементов $a_i$ в наборе  $(a_1,a_2,\ldots,a_k)$:
$$
A=\{\omega:\,\,a_1\neq a_2\neq\ldots\neq a_k\}.
$$
Из элементарной комбинаторики известно, что $|A|=(n)_k$ --- количеству $k$-перестановок из $n$ элементов без повторений. Как следствие, 
$$
\Pr(A)=\dfrac{|A|}{|\Omega|}=\dfrac{(n)_k}{n^k}=\biggl(1-\dfrac{1}{n}\biggr)\biggl(1-\dfrac{2}{n}\biggr)\ldots\biggl(1-\dfrac{k-1}{n}\biggr).
$$
\end{examp}

Рассмотренный пример является достаточно характерным --- многие задачи элементарной комбинаторики могут быть переформулированы на языке теории вероятности. Например, задача об определении количества трехзначных чисел, содержащих цифры 3 и 6, может рассматриваться и как задача о нахождении вероятности того, что произвольно выбранное трехзначное число содержит цифры 3 и 6. 


\myitem Перейдем теперь к важному понятию независимых событий.

\mysubitem Начнем с достаточно характерного примера. Пусть мы имеем колоду, состоящую из $52$-х карт, и пусть событие $A$ состоит в том, что мы вытягиваем из колоды карту пиковой масти. Вероятность этого события равна, очевидно, одной четвертой: 
$$
\Pr(A)=\dfrac{13}{52}=\dfrac{1}{4}.
$$
Рассмотрим теперь событие $B$, заключающееся в том, что мы во второй раз из колоды вытягиваем карту, и эта карта также оказывается пиковой масти. Дальнейшие наши рассуждения существенным образом зависят от того, возвращаем ли мы после первого испытания карту обратно в колоду или нет. 

Предположим вначале, что мы эту карту после первого испытания обратно в колоду возвращаем. В этом случае второе испытание ничем у нас от первого не отличается. Поэтому вероятность события $B$ совпадает с вероятностью события $A$, а вероятность вытащить в обоих испытаниях карту пиковой масти, равна, очевидно, 
$$
\Pr(A\cap B)=\Pr(A)\cdot \Pr(B)=\dfrac{1}{16}.
$$

Теперь предположим, что мы после первого испытания карту в колоду обратно не возвращаем. В этом случае в колоде у нас остается пятьдесят одна карта, а вероятность вытащить во второй раз карту пиковой масти начинает зависеть от того, карту какой масти мы вытащили в первый раз.

Так, если мы в первый раз вытащили карту пиковой масти (то есть если у нас наступило событие $A$), то в колоде осталось $12$ карт данной масти. Обозначим через $\Pr(B|A)$ вероятность наступления события $B$ при условии того, что до него произошло событие $A$. Ясно, что эта вероятность равна $12/51=4/17$. При этом вероятность $\Pr(A\cap B)$ вытащить карту пиковой масти в обе попытки рассчитывается так:
$$
\Pr(A\cap B)=\Pr(B|A)\cdot \Pr(A)=\dfrac{4}{17}\cdot \dfrac{1}{4}=\dfrac{1}{17}.
$$
Предположим теперь, что мы в первый раз вытащили карту какой-то другой, отличной от пиковой масти (то есть у нас произошло событие $\bar{A}$). В этом случае вероятность $\Pr(B|\bar{A})$ вытащить карту пиковой масти при условии того, что в первый раз была вытащена карта другой масти равна $13/51$. Заметим, что у нас при этом выполняется любопытное равенство вида
\begin{equation}
\label{eq:eq:full_prob_example}
\Pr(A)\cdot \Pr(B|A)+\Pr(\bar{A})\cdot \Pr(B|\bar{A})=\dfrac{1}{4}\cdot \dfrac{12}{51}+\dfrac{3}{4}\cdot \dfrac{13}{51}=\dfrac{1}{4}=\Pr(B),
\end{equation}
где $\Pr(B)$ --- вероятность события $B$, заключающегося в появлении пиковой масти при однократном вытаскивании карты из полной колоды. 

\mysubitem Подведем теперь предварительные итоги. В случае, когда мы после первого испытания возвращаем вытащенную карту обратно в колоду, вероятность события $B$ никак не зависит от вероятности наступления события $A$, а вероятность $P(A\cap B)$ наступления обоих событий рассчитывается как произведение вероятностей $P(A)$ и $P(B)$. 

\begin{defin}
События $A$ и $B$ называются  \emph{независимыми,} если вероятность $\Pr(A\cap B)$ наступления обоих событий одновременно рассчитывается по формуле
$$
\Pr(A\cap B)=\Pr(A)\cdot \Pr(B).
$$
\end{defin}

Во втором случае, когда мы вытащенную в первый раз карту в колоду обратно не возвращаем, вероятность наступления события $B$ зависит от того, произошло ли при первом испытании событие $A$ или нет. Такого рода события называются \emph{зависимыми,} а введенные выше вероятности $\Pr(B|A)$ и $\Pr(B|\bar{A})$ называются \emph{условными вероятностями.} Формулу вида 
\begin{equation}
\label{eq:def_cond_prob}
\Pr(B|A)=\dfrac{\Pr(A\cap B)}{\Pr(A)},\qquad \Pr(A)>0,
\end{equation}
принимают при этом за определение условной вероятности $\Pr(B|A)$. В случае независимых событий $\Pr(B|A)=\Pr(B)$. 

\begin{figure}[h]
\centering
  \includegraphics[scale=0.3]{pics/prob_cond.eps}
\caption{}
\label{fig:prob_cond}
\end{figure}



Формулу (\ref{eq:def_cond_prob}) можно объяснять для себя следующим образом: предположение о том, что произошло событие $A$, ограничивает для события $B$ множество возможных исходов до $A$, так что вместо формулы $\Pr(B)=\Pr(B)/\Pr(\Omega)$ мы получаем формулу (\ref{eq:def_cond_prob}) (смотри рис.\ref{fig:prob_cond}).

\mysubitem Вернемся теперь к формуле (\ref{eq:eq:full_prob_example}). Такого рода формула называется  \emph{формулой полной вероятности.} Ее обычно записывают в несколько более общем виде. Именно, рассмотрим полную группу несовместных событий $A_1,A_2,\ldots,A_n$. Ясно, что
$$
B=B\cap \Omega=(B\cap A_1)\cup (B\cap A_2)\cup\ldots\cup(B\cap A_n),
$$
откуда на основании свойства  (\ref{eq:sum_prob_ind}) следует, что
$$
\Pr(B)=\Pr(B\cap A_1)+\Pr(B\cap A_2)+\ldots+\Pr(B\cap A_n).
$$
С учетом формулы (\ref{eq:def_cond_prob}) вероятности $\Pr(B\cap A_i)$ можно выразить через условные вероятности $\Pr(B|A_i)$:
\begin{equation}
\label{eq:cap_prob}
\Pr(B\cap A_i)=\Pr(B|A_i)\cdot \Pr(A_i).
\end{equation}
Отсюда окончательно получается следующая обобщенная формула полной вероятности:
\begin{equation}
\label{eq:full_prob}
\Pr(B)=\sum\limits_{i=1}^nP(B|A_i)\cdot \Pr(A_i).
\end{equation}

Приведем достаточно характерный пример использования формулы (\ref{eq:full_prob}). 

\begin{examp} \label{examp:full_prob}
Пусть в магазине имеется $100$ лампочек, $60$ из которых сделаны производителем номер $1$, $25$ --- производителем номер $2$, и $15$ --- производителем номер $3$. Вероятность выхода из строя лампочки в первую неделю ее работы у первого производителя равна $0.02$, у второго --- $0.01$, и у третьего --- $0.03$. Какова вероятность того, что случайно купленная в магазине лампочка выйдет из строя в течение первой недели?
\end{examp}

\decis Обозначим через $A_i$ событие, заключающееся в том, что купленная лампочка принадлежит $i$-му производителю. Очевидно, что событие $\Omega$, отвечающее покупке лампочки, является достоверным событием (то есть $\Pr(\Omega)=1$), а $A_1\cup A_2\cup A_3=\Omega$, то есть события $A_i$ образуют полную группу несовместных событий. При этом $\Pr(A_1)=0.6$, $\Pr(A_2)=0.25$, $\Pr(A_3)=0.15$. 

Далее, вероятность выхода из строя лампочки в первую неделю ее работы у $i$-го производителя является, очевидно, условной вероятностью $\Pr(B|A_i)$, где $B$ --- событие, состоящее в выходе из строя лампочки в первую неделю ее работы. Следовательно, согласно формуле (\ref{eq:full_prob}) полной вероятности,
$$
\Pr(B)=0.6\cdot 0.02+0.25\cdot 0.01+0.03\cdot 0.15=0.019.
$$
 

\mysubitem В примере \ref{examp:full_prob} постановка задачи была в определенном смысле прямой: у нас было известно, что хотя бы одно из трех событий $A_i$ произошло (лампочка была куплена), и мы искали вероятность наступления события $B$, состоящего в том, что купленная нами в магазине лампочка в первую неделю перегорела. На практике, однако, нас может интересовать и такая постановка задачи: пусть лампочка у нас в первую неделю все же перегорела; какова вероятность того, что в этом случае (то есть при наступлении события $B$) эта лампочка принадлежит, к примеру, $2$-му производителю?

С формальной точки зрения речь идет о вычислении условной вероятности $\Pr(A_i|B)$: событие $B$ произошло, плюс произошло и какое-то из трех возможных событий $A_i$; нас же интересует вероятность того, что в этом случае до наступления события $B$ случилось именно событие $A_2$, а не два других события. 

Оказывается, на такой вопрос также достаточно легко ответить. Именно, предположим, что вероятность $\Pr(B)$ события $B$ строго больше нуля. Заметим, что тогда наряду с формулами 
$$
\Pr(B|A_i)=\dfrac{\Pr(B\cap A_i)}{\Pr(A_i)} \qquad \Longleftrightarrow \qquad \Pr(B\cap A_i)=\Pr(B|A_i)\cdot \Pr(A_i)
$$ 
для любого $i=1,2,\ldots,n$ мы можем написать и аналогичные равенства
$$
\Pr(B\cap A_i)=\Pr(A_i|B)\cdot \Pr(B)  \qquad \Longleftrightarrow \qquad \Pr(A_i|B)=\dfrac{\Pr(B\cap A_i)}{\Pr(B)}.
$$
Вспоминая теперь, что $\Pr(B\cap A_i)$ вычисляется по формуле (\ref{eq:cap_prob}), а также то, что для $\Pr(B)$ справедлива формула полной вероятности (\ref{examp:full_prob}), мы для $\Pr(A_i|B)$ получаем соотношение
\begin{equation}
\label{eq:Bayes_form_full}
\Pr(A_i|B)=\dfrac{\Pr(A_i)\cdot \Pr(B|A_i)}{\Pr(A_1)\cdot \Pr(B|A_1)+\Pr(A_2)\cdot \Pr(B|A_2)+\ldots +\Pr(A_n)\cdot \Pr(B|A_n)}.
\end{equation}
В частности, в нашей задаче вероятность того, что лампочка была изготовлена вторым производителем, равна
$$
\Pr(A_2|B)=\dfrac{0.25\cdot 0.01}{0.6\cdot 0.02+0.25\cdot 0.01+0.03\cdot 0.15}=\dfrac{0.01\cdot 0.25}{0.019}=\dfrac{5}{38}=0.13.
$$

\mysubitem Формула (\ref{eq:Bayes_form_full}) носит название \emph{теоремы Байеса} и играет достаточно важную роль в разного рода практических задачах. В этих задачах события $A_i$ часто называют \emph{гипотезами,} вероятность $\Pr(A_i)$ --- \emph{априорной} вероятностью гипотезы $A_i$, а вероятность $\Pr(A_i|B)$ трактуется как \emph{апостериорная} вероятность наступления события $A_i$, то есть вероятность этого события \emph{после} наступления события $B$. 

Одна из наиболее популярных задач в этой области --- это нахождение так называемой \emph{наиболее вероятной гипотезы,} то есть события $A_i$, для которого $\Pr(A_i|B)$ будет наибольшим среди всех $A_i$. В нашей задаче таковой будет, очевидно, гипотеза, состоящая в том, что перегоревшая лампочка была изготовлена первым предприятием:
$$
\Pr(A_1|B)=\dfrac{0.6\cdot 0.02}{0.019}=\dfrac{12}{19}=0.63.
$$

Так как знаменатель в формуле Байеса (\ref{eq:Bayes_form_full}) равен $\Pr(B)$ и не зависит от $A_i$, то общем случае для определения наиболее вероятной гипотезы следует найти такую гипотезу $A_i$, для которой величина $\Pr(B|A_i)\cdot \Pr(A_i)$ будет максимальной. 

Довольно часто в такого рода задачах все априорные вероятности считаются одинаковыми и равными $1/n$. В этом случае наиболее вероятной гипотезой будет, очевидно, событие $A_i$ с наибольшей условной вероятностью $\Pr(B|A_i)$. 



\myitem Вернемся к чрезвычайно важному в теории вероятности понятию независимости случайных событий.

\mysubitem Обычно определить, являются ли какие-то два отдельных события $A$ и $B$ независимыми, довольно затруднительно. Например, не проводя соответствующих вычислений, не очень понятно, являются ли независимыми события ``выпадение на кубике нечетного числа'' и ``выпадение на кубике числа, меньшего или равного трем''. Однако существует довольно распространенная конструкция, в которой пары независимых событий возникают довольно естественно, по построению. Для того, чтобы эту конструкцию проще было понять, мы опишем вначале схему ее построения на достаточно простом, но в то же время важном примере --- на так называемой схеме Бернулли.

\mysubitem Рассмотрим случайный эксперимент, состоящий из последовательности $n$ одинаковых независимых случайных испытаний, то есть таких испытаний, результаты каждого из которых никак не зависят от результатов прочих испытаний. Предположим, что в каждом таком испытании возможны ровно два исхода, называемые успехом и неудачей, причем вероятность успеха в каждом эксперименте одинакова и равна $p\in(0,1)$, а вероятность $q$ неудачи равна, соответственно, $1-p$. Такого рода случайный эксперимент и называется \emph{схемой Бернулли}. 

Данная схема моделирует, например, случайный эксперимент, заключающийся в $n$-кратном подбрасывании монетки. Если монетка правильная, то $p=q=1/2$. В противном случае имеем так называемую несимметричную монетку, для которой $p\neq q$. Кроме этого простейшего примера, схема Бернулли моделирует множество других случайных экспериментов \cite{Shiryaev}. 

\mysubitem С целью формального описания схемы Бернулли вернемся к простейшему случайному эксперименту, заключающемуся в подбрасывании монетки. Напомним, что вероятностное пространство для такого эксперимента описывается соотношениями (\ref{eq:prob_space_coin_1})--(\ref{eq:prob_space_coin_2}).

Теперь несколько усложним его, а именно, предположим, что мы $n$ раз подбрасываем данную монету. Результат любого такого эксперимента можно записать в виде битовой строки вида $(a_1,a_2,\ldots,a_n)$, в которой $a_i=1$ в случае, если, например, у нас выпала решка, и $a_i=0$ в случае выпадения орла. При таком подходе пространство всех исходов $\Omega_n$ и алгебра событий $\mathcal A_n$ имеют вид
\begin{equation}
\label{eq:prob_space_coin_n1}
\Omega_n=\{\omega:\,\,\omega=(a_1,a_2,\ldots,a_n)\},\qquad
 \mathcal A_n=2^{\Omega_n}.
\end{equation}
Покажем, что вероятность $\Pr_n$ любого элементарного события $\omega$ можно в этом случае задать с помощью соотношения
\begin{equation}
\label{eq:prob_space_coin_n2}
\Pr_n(\omega)=p^kq^{n-k},\qquad \qquad k=\sum\limits_{i=1}^na_i, \qquad\qquad p,q>0,\qquad p+q=1.
\end{equation}
Действительно, очевидно, что $\Pr_n(\omega)\in (0,1)$. Кроме того, количество всех элементарных исходов, для которых $\sum_{i}a_i=k$, совпадает с количеством $\BCf{n}{k}$ битовых строк длины $n$, содержащих $k$ единиц. Поэтому 
$$
\sum\limits_{\omega\in\Omega_n}\Pr_n(\omega)=\sum\limits_{k=0}^n\BCf{n}{k}p^kq^{n-k}=(p+q)^n=1.
$$
Следовательно, описываемая приведенными выше соотношениями (\ref{eq:prob_space_coin_n1})--(\ref{eq:prob_space_coin_n2}) тройка $(\Omega_n,\mathcal A_n,\Pr_n)$ определяет вероятностную модель, описывающую $n$-кратное подбрасывание монеты.

Обозначим через $A_k$ событие, состоящее в том, что в результате серии $n$ испытаний произошло ровно $k$ успехов. Как мы только что показали, вероятность такого события равна
\begin{equation}
\label{eq:binom_prob}
\Pr_n(A_k)=\BCf{n}{k}\,p^k\,q^{n-k},\qquad\qquad k=0,1,\ldots,n.
\end{equation}
Очевидно, что набор $\{A_0,A_1,\ldots,A_n\}$ образует полную группу несовместных событий. Соответствующий этим событиям  набор вероятностей $\{\Pr_n(A_0),\Pr_n(A_1),\ldots,\Pr_n(A_n)\}$ называется \emph{биномиальным распределением} количества успехов в $n$ испытаниях. 

\mysubitem Перейдем теперь к описанию независимых событий в схеме Бернулли. 

\begin{defin}
Говорят, что событие $B_k$ зависит только от $k$-го испытания, если появление этого события определяется только лишь значением $a_k$. 
\end{defin}

Самым простым и самым важным событием такого рода является событие $B_k$ вида
$$
B_k=\{\omega:\,\,\,a_k=1\},\qquad\qquad \bar B_k=\{\omega:\,\,\,a_k=0\}.
$$
Иными словами, событие $B_k$ заключается в появлении успеха, а $\bar B_k$ --- неудачи на $k$-м испытании. Ясно, что
$$
\Pr(B_k)=p,\qquad\qquad \Pr(\bar B_k)=q.
$$
Несложно с помощью формальных выкладок также показать, что для всех $k\neq l$ 
$$
\Pr(B_k\cap B_l)=p^2,\qquad \Pr(B_k\cap \bar B_l)=p\cdot q, \qquad \Pr(\bar B_k\cap \bar B_l)=q^2.
$$
Следовательно, все такие события являются попарно независимыми. Более того, оказывается, что эти события являются также независимыми в совокупности, то есть такими событиями, для которых равенство 
$$
\Pr(B_{k_1}\cap B_{k_2}\cap\ldots\cap B_{k_i})=\Pr(B_{k_1})\cdot \Pr(B_{k_2})\cdot\ldots\cdot \Pr(B_{k_i})
$$
выполняется для любых $i=1,\ldots,n$, $1\leq k_1<k_2<\ldots<k_i\leq n$. Независимость событий $B_k$ и дает формальное основание называть построенную вероятностную модель $(\Omega_n,\mathcal A_n,\Pr_n)$ моделью, отвечающую $n$ независимым испытаниям с двумя исходами, или схемой Бернулли.

\mysubitem Заметим теперь, что формально та же самая схема Бернулли может быть построена и несколько по-другому. Именно, вернемся к элементарной вероятностной модели (\ref{eq:prob_space_coin_1})--(\ref{eq:prob_space_coin_2}), описывающей однократное подбрасывание монетки, и рассмотрим декартовое произведение $n$ множеств $\Omega_1$:
$$
\Omega_1\times\Omega_1\times\ldots\times\Omega_1:=\Omega.
$$
Элементами $\omega$ этого множества $\Omega$ будут, как и в предыдущем случае, упорядоченные наборы вида $(a_1,a_2,\ldots,a_n)$, в которых $a_i\in\Omega_1$. Алгебра $\mathcal A$ ее подмножеств строится из множеств вида $A_1\times\ldots\times A_1$, $A_1\in \mathcal A_1$. Наконец, для любого $\omega=(a_1,a_2,\ldots,a_n)$ положим 
$$
\Pr(\omega)=\Pr_1(a_1)\cdot \Pr_1(a_2)\cdot\ldots\cdot \Pr_1(a_n).
$$
Несложно убедиться, что получаемая в итоге тройка $(\Omega,\mathcal A,\Pr)$ образует вероятностную модель, полностью эквивалентную введенной выше модели $(\Omega_n,\mathcal A_n,\Pr_n)$, то есть также описывающую схему Бернулли. 

\mysubitem Вернемся теперь к началу данного пункта и опишем общую схему построения такой вероятностной модели, в которой достаточно естественно возникают пары независимых событий. Сразу заметим, что эта схема легко обобщается на случай $n$ независимых событий. 

Пусть $(\Omega_1,\mathcal A_1,\Pr_1)$ и $(\Omega_2,\mathcal A_2,\Pr_2)$ --- пара вероятностных моделей. Образуем декартово произведение пары множеств элементарных событий $\Omega_1\times\Omega_2$, которое обозначим через $\Omega$. Затем из набора подмножеств вида $A_1\times A_2$, $A_1\in \mathcal A_1$, $A_2\in \mathcal A_2$ стандартным образом построим алгебру событий $\mathcal A$. Наконец, вероятность на этой алгебре событий определим так: для любых $A_1\in \mathcal A_1$, $A_2\in \mathcal A_2$
$$
\Pr(A_1\times A_2)=\Pr_1(A_1)\cdot \Pr_2(A_2).
$$
Полученная тройка $(\Omega,\mathcal A,\Pr)$ в этом случае будет представлять собой некоторую вероятностную модель, в которой любые события вида $(A_1,\Omega_2)$ и $(\Omega_1,A_2)$ гарантированно являются независимыми. На практике большинство примеров независимых событий имеют именно такую природу. 


\section*{Упражнения}


\begin{exerc} 
Рассмотрим лотерею ``пять из тридцати шести'', победителем которой является человек, правильно угадавший пять из тридцати шести чисел $1,2,\ldots,36$. Определить вероятность того, что какой-то наугад выбранный набор из пяти чисел выиграет.
\end{exerc}

\begin{exerc} 
Вычислить вероятность того, что при игре в лотерею ``пять из тридцати шести'' в произвольно выбранном наборе из пяти чисел хотя бы одно будет правильным.
\end{exerc}

\begin{exerc} 
Вычислить вероятность угадывания ровно трех из правильных пяти номеров в лотерее ``пять из тридцати шести''.
\end{exerc}

\begin{exerc} 
Три студента решают независимо друг от друга одну и ту же задачу. Вероятности решения студентами этой задачи равны, соответственно, $0.8$, $0.7$ и $0.6$. Найти вероятность того, что хотя бы один из них решит задачу.
\end{exerc}

\begin{exerc} 
Рассматривается вероятностный эксперимент, заключающийся в бросании двух игральных кубиков. Мощность множества элементарных исходов в таком эксперименте равна $36$, так как исходы вида ``на первом кубике выпала единица, на втором --- двойка'' и ``на первом кубике выпала двойка, на втором --- единица'', считаются различными. Какова вероятность того, что сумма значений на кубике равна семи, если известно, что сумма --- нечетная?
\end{exerc}

\begin{exerc} 
Рассмотрим произвольную перестановку трех элементов вида $p=p_1p_2p_3$. Обозначим через $A$ событие, состоящее в том, что $p_1>p_2$, а через $B$ --- событие, заключающееся в том, что $p_2>p_3$. Являются ли эти события независимыми?
\end{exerc}


\begin{exerc}
Из двух мешков для лото, содержащих бочонки с числами от 1 до 90, достают по бочонку. Зависимы ли события $A$ и $B$, если $A$ есть выпадение чётной суммы, $B$~--- выпадение суммы, большей 140?
\end{exerc}

\begin{exerc} 
Монету подбрасывают три раза. Нам не показывают результат, но говорят, что решка выпала хотя бы один раз. Какова вероятность того, что решка выпала все три раза?
\end{exerc}

\begin{exerc} 
По статистике, $30\%$ из общего количества студентов, которым читается данный курс, сдают экзамен с первой попытки и в срок, $50\%$ с первой попытки его не сдают, но успевают пересдать экзамен в течение основной сессии, а оставшиеся $20\%$ либо вовсе экзамен не сдают, либо сдают его в допсессию. Известно, что среди студентов первой группы $95\%$ успешно заканчивают свое обучение в университете, среди студентов второй группы эта величина составляет $60\%$, а среди тех, кто в основную сессию данный курс не сдал, доля получивших в итоге диплом составляет $20\%$. Определить процент студентов, успешно защищающих диплом, по отношению к общему числу поступивших студентов. 
\end{exerc}

\begin{exerc} 
Предположим, что тест на наркотики дает $99\%$ истинно положительных результатов для людей, употребляющих наркотики, и $98.5\%$ истинно отрицательных результатов для людей, наркотики не употребляющие. Предположим, что в мире существует $0,5\%$ наркоманов, и пусть произвольно выбранный тест показал положительный результат на применение наркотиков. Какова вероятность того, что человек, сдавший тест, действительно является наркоманом?
\end{exerc}

\begin{exerc}
Из десяти стрелков пять попадают в цель с вероятностью, равной $80\%$, три - с вероятностью, равной $50\%$,  
и два – с вероятностью $90\%$. Наудачу выбранный стрелок произвел выстрел, поразив цель. К какой из групп вероятнее всего принадлежал этот стрелок?
\end{exerc}

\begin{exerc}
Предположим, что у нас имеются три монетки, две из которых правильные, а третья является несимметричной, вероятность выпадения орла у которой $p=1/3$. Мы случайным образом выбираем из этих трех монеток одну и подбрасываем ее пять раз. В результате такого эксперимента у нас один раз выпадает орел и четыре раза решка. Какая монетка была выбрана с большей вероятностью~--- идеальная или несимметричная?
\end{exerc}

\begin{exerc}
Игральная кость подбрасывается десять раз. Какова вероятность трехкратного выпадения шестерки?
\end{exerc}

\section*{Решение упражнений}

\begin{sol_exerc}
Очевидно, что вероятность такого элементарного события $\omega$ равна
$$
\Pr(\omega)=\dfrac{1}{|\Omega|},
$$
где $\Omega$ есть множество всех возможных элементарных событий. Мощность этого множества совпадает с количеством $5$-элементных подмножеств $36$-элементного множества, то есть равна $\BCf{36}{5}$. Следовательно,
$$
\Pr(\omega)=\dfrac{1}{\BCf{36}{5}}=\dfrac{5!\cdot 31!}{36!}=\dfrac{5!}{32\cdot 33\cdot 34\cdot 35\cdot 36}=\dfrac{1}{376992}=2,65\cdot 10^{-6}.
$$
\end{sol_exerc}

\begin{sol_exerc}
Для решения данной задачи введем два события --- событие $A$, заключающееся в том, что человек угадывает хотя бы одну правильную цифру, и событие $B=\bar{A}$, состоящее в том, что он все цифры угадал неправильно. В этой задаче легче найти вероятность события $B$, а затем из формулы 
$$
\Pr(A)=1-\Pr(B)
$$
определить вероятность искомого события $A$. Действительно, вероятность того, что все пять цифр будут неправильными, определяется количеством всех $5$-подмножеств $(36-5)=31$-элементного множества. Следовательно,
$$
\Pr(A)=1-\dfrac{\BCf{31}{5}}{\BCf{36}{5}}=0.549.
$$
\end{sol_exerc}

\begin{sol_exerc}
Один из возможных способов решения задачи следующий: выберем два числа из пяти выигрышных $(\BCf{5}{2}$ способами) и заменим их на любые два из тридцати одного невыигрышных числа $(\BCf{31}{2}$ способами). Согласно правилу произведения, эти операции можно сделать $\BCf{5}{2}\cdot \BCf{31}{2}$ способами, и поэтому вероятность угадать ровно три числа равна
$$
\Pr(A)=\dfrac{\BCf{5}{2}\cdot \BCf{31}{2}}{\BCf{36}{5}}=0.00123.
$$
\end{sol_exerc}

\begin{sol_exerc}
Пусть $A_i$ есть событие, состоящее в том, что $i$-й студент решил задачу. Вероятности этих событий равны, по условию, $\Pr(A_1)=0.8$, $\Pr(A_2)=0.7$ и $\Pr(A_3)=0.6$. Рассмотрим теперь событие $B$, заключающееся в том, что хотя бы один из студентов решил задачу. Проще искать вероятность не события $B$, а противоположного ему события $\bar B$, описывающего ситуацию, когда ни один из студентов задачу не решил. Вероятность такого события равна
$$
\Pr(\bar B)=\Pr(\bar A_1\cap \bar A_2\cap \bar A_3)=\Pr(\bar A_1)\cdot \Pr( \bar A_2) \cdot \Pr( \bar A_3)=0.2\cdot 0.3\cdot 0.4=0.024.
$$  
Следовательно,
$$
\Pr(B)=1-\Pr(\bar B)=0.976.
$$
\end{sol_exerc}

\begin{sol_exerc}
Существует всего шесть элементарных исходов, отвечающих событию ``на паре кубиков выпало семь очков''. При этом общее количество элементарных исходов, дающих нечетную сумму, составляет ровно половину от общего количества элементарных исходов. Следовательно, вероятность выпадения семи очков равна $6/18=1/3$.     
\end{sol_exerc}

\begin{sol_exerc}
Для ответа на поставленный вопрос нам нужно сосчитать вероятность $\Pr(A\cap B)$ и сравнить ее с произведением вероятностей $\Pr(A)$ и $\Pr(B)$. Последние, очевидно, равны $\Pr(A)=\Pr(B)=1/2$, так как для любой перестановки, у которой, например, $p_1>p_2$, существует обратная ей перестановка, у которой $p_1<p_2$. Событие $A\cap B$ отвечает перестановке, у которой $p_1>p_2>p_3$, и вероятность появления такого рода перестановки равна, очевидно, $1/6$. Это число отлично от $1/4=\Pr(A)\cdot \Pr(B)$, что означает, что события $A$ и $B$ являются зависимыми.    
\end{sol_exerc}


\begin{sol_exerc} 
Для решения задачи необходимо сравнить вероятность $\Pr(A \cap B)$ с произведением вероятностей $\Pr(A)\cdot \Pr(B)$. Достаточно очевидно, что вероятность события $A$ равна $\Pr(A)=0.5$: любому бочонку из первого мешка соответствует 45 бочонков из второго, дающих чётную сумму, и 45~--- дающих нечётную. Непосредственный подсчёт $\Pr(B)$ и $\Pr(A \cdot B)$ весьма утомителен, однако мы можем его избежать, воспользовавшись следующими  рассуждениями. 

Из очевидного равенства $\Pr(B)=\Pr(B\cap A)+\Pr(B \cap \bar A)$ следует, что если $\Pr(B\cap A)=\Pr(B \cap \bar A)$, то $\Pr(B\cap A)=\Pr(B)\cdot (1/2)=\Pr(B)\cdot \Pr(A)$. Иначе говоря, в случае $\Pr(B\cap A)=\Pr(B \cap \bar A)$ события $A$ и $B$ являются независимыми. Нам, таким образом, осталось проверить, равны ли условные вероятности $\Pr(B\cap A)$ и $\Pr(B \cap \bar A)$.

Обозначим через $\Pr(S=x)$ вероятность того, что сумма $S$ чисел на бочонках равна $x$. Тогда
$$
\Pr(B\cap A) = \Pr(S=142)+\Pr(S=144)+\ldots + \Pr(S=180),
$$
$$
\Pr(B\cap \bar A) = \Pr(S=141)+\Pr(S=143)+\ldots + \Pr(S=179).
$$
Вероятность же $\Pr(S=x)$ в случае $x>140$ довольно легко сосчитать --- она равна 
$$
\Pr(S=x) = \dfrac{181 - x}{|\Omega|},
$$
где $\Omega$ --- множество всех возможных исходов данного случайного эксперимента. Действительно, количество исходов, дающих на выходе сумму чисел, равную $x$, совпадает с количеством чисел $n$, лежащих в диапазоне от $x-90$ до $90$: выбирая любое такое $n$ на первом бочонке, мы на втором бочонке должны однозначно выбрать число $x-n$. Как следствие, для случая $x>140$ вероятность $\Pr(S=2k) < \Pr(S=2k-1)$, вероятность $\Pr(B \cap A) < \Pr(B \cap \bar A)$, а значит, события $A$ и $B$~--- зависимы.
\end{sol_exerc}


\begin{sol_exerc}
Обозначим через $A$ событие, состоящее в том, что хотя бы при одном подбрасывании монеты выпала решка, а через $B$ --- событие, состоящее в том, что все три раза у нас выпала решка. Нам необходимо найти условную вероятность $\Pr(B|A)$. Воспользуемся для этого формулой (\ref{eq:def_cond_prob}). Заметим, что $A\cap B=B$, и потому $\Pr(A\cap B)=\Pr(B)=(1/2)^3=1/8$. Далее, вероятность $\bar A$ того, что во всех трех подбрасываниях монеты выпали три орла, также равна $1/8$, и поэтому $\Pr(A)=1-\Pr(\bar A)=7/8$. Следовательно,
$$
\Pr(B|A)=\dfrac{\Pr(A\cap B)}{\Pr(A)}=\dfrac{\Pr(B)}{\Pr(A)}=\dfrac{1}{7}.
$$   
\end{sol_exerc}

\begin{sol_exerc}
Обозначим через $A_1$ событие, состоящее в том, что произвольно выбранный студент сдал данный курс с первого раза и в срок, через $A_2$ --- событие, заключающееся в том, что этот студент сдал курс в основную сессию, и через $A_3$ --- событие, состоящее в том, что студент данный курс в основную сессию не сдал. Эти события образуют полную группу несовместимых событий, причем
$$
\Pr(A_1)=0.3,\qquad \Pr(A_2)=0.5,\qquad \Pr(A_3)=0.2.
$$
Через $B$ обозначим событие, заключающееся в том, что студент успешно окончил университет. Из условия задачи имеем следующие условные вероятности $\Pr(B|A_i)$:
$$
\Pr(B|A_1)=0.95,\qquad \Pr(B|A_2)=0.6,\qquad \Pr(B|A_3)=0.2.
$$
Подставляя эти значения в формулу (\ref{eq:full_prob}) полной вероятности, получаем, что вероятность $\Pr(B)$ произвольно выбранному вновь поступившему студенту успешно закончить университет равна
$$
\Pr(B)=0.95\cdot 0.3+0.6\cdot 0.5+0.2\cdot 0.2=0.625.
$$
\end{sol_exerc}

\begin{sol_exerc} 
Обозначим через $A_1$ гипотезу, состоящую в том, что человек наркотики употребляет, а через $A_2=\bar{A}_1$ --- гипотезу, состоящую в том, что человек наркоманом не является. Из условия задачи известно, что $\Pr(A_1)=0.005$; следовательно, $\Pr(A_2)=0.995$.

Предположим теперь, что у нас произошло событие $B$, заключающееся в том, что тест показал положительный результат. Нам нужно сосчитать вероятность $\Pr(A_1|B)$ того, что человек, для которого тест дал положительный результат, действительно употребляет наркотики. Для этого воспользуемся формулой (\ref{eq:Bayes_form_full}). 

Апостериорная вероятность $\Pr(B|A_1)$ того, что тест дает положительный результат в случае, когда человек действительно наркотики употребляет, по условию равна $\Pr(B|A)=0.99$. Апостериорная вероятность $\Pr(B|A_2)$ того, что тест дает положительный результат, но человек наркотики не употребляет, равна $0.015$. Таким образом, согласно формуле (\ref{eq:Bayes_form_full}) имеем
$$
\Pr(A_1|B)=\dfrac{0.99\cdot 0.005}{0.99\cdot 0.005+0.015\cdot 0.995}=0.249.
$$

Как видно, несмотря на относительную аккуратность проводимых исследований, то, что тест оказывается положительным, означает, что с высокой вероятностью человек, сдавший этот тест, наркоманом не является.
\end{sol_exerc}


\begin{sol_exerc} 
Обозначим через $B$ событие, состоящее в том, что цель поражена, а через $A_i$ --- событие, заключающееся в том, что стрелял стрелок из $i$-й группы. Вероятности $\Pr(A_i)$ равны, по условию задачи,
$$
\Pr(A_1)=0.5,\qquad \Pr(A_2)=0.3,\qquad \Pr(A_3)=0.2.
$$
Далее, апостериорные вероятности попадания в цель равны
$$
\Pr(B|A_1)=0.8,\qquad \Pr(B|A_2)=0.5,\qquad \Pr(B|A_3)=0.9.
$$
Нам нужно определить, при каком $i$ достигается максимум произведения $\Pr(B|A_i)\cdot \Pr(A_i)$. Так как
$$
\Pr(B|A_1)\cdot \Pr(A_1)=0.4,\qquad \Pr(B|A_2)\cdot \Pr(A_2)=0.15,\qquad \Pr(B|A_3)\cdot \Pr(A_3)=0.18,
$$
то вероятнее всего то, что стрелок, попавший в цель, принадлежал к первой группе. 
\end{sol_exerc}


\begin{sol_exerc} 
Обозначим через $B$ событие, состоящее в том, что в серии из пяти испытаний один раз выпал орел, через $A_1$ --- гипотезу, состоящую в том, что была выбрана идеальная монета, а через $A_2$ --- гипотезу о том, что выбранная монета была несимметричной. По условию,
$$
\Pr(A_1)=\frac{2}{3},\qquad \Pr(A_2)=\frac{1}{3},\qquad \Pr(A_1)+\Pr(A_2)=1.
$$
Условные вероятности вида $\Pr(B|A_i)$ можно в данной задачи вычислить с использованием формулы (\ref{eq:binom_prob}):
$$
\Pr(B|A_1)=\BCf{5}{1}\cdot\Bigl(\dfrac{1}{2}\Bigr)^5=\dfrac{5}{32};\qquad \Pr(B|A_2)=\BCf{5}{1}\cdot \dfrac{1}{3} \cdot \Bigl(\frac{2}{3}\Bigr)^4=\dfrac{80}{243}.
$$
Более вероятной гипотезой будет та, у которой выражение $\Pr(B|A_i)\cdot P(A_i)$ будет максимальным. Так как
$$
\Pr(B|A_1)\cdot P(A_1)=\dfrac{5}{32}\cdot\dfrac{2}{3}=\dfrac{5}{48}=0.104,\qquad 
\Pr(B|A_2)\cdot P(A_2)=\dfrac{80}{243}\cdot \dfrac{1}{3}=\frac{80}{729}=0.1097,
$$
то более вероятно то, что изначально была выбрана несимметричная монетка.
\end{sol_exerc}

\begin{sol_exerc} 
Вероятность $p$ выпадения шестерки при однократном подбрасывании кубика равна $1/6$, вероятность $q$ выпадения любой другой цифры равна $5/6$. Следовательно, согласно формуле (\ref{eq:binom_prob}), вероятность трехкратного выпадения шестерки после десяти подбрасываний равна
$$
\BCf{10}{3}\cdot \left(\dfrac{1}{6}\right)^3\cdot \left(\dfrac{5}{6}\right)^7=0.155.
$$
\end{sol_exerc}




\section{Случайные величины}

\myitem Начнем с определения случайной величины.

\begin{defin} 
Случайной величиной называется произвольная вещественная функция  $\xi=\xi(\omega)$, определенная на (конечном) пространстве $\Omega$ элементарных событий. 
\end{defin}

Так как обычно в каждой конкретной задаче имеется лишь одно пространство $\Omega$, то вместо $\xi(\omega)$ мы, как правило, будем просто писать $\xi$.

В дальнейшем мы многие понятия будем объяснять на следующем простейшем примере.

\begin{examp} \label{examp:dice_random}
Рассмотрим случайный эксперимент, состоящий в подбрасывании двух игральных костей. Случайную величину  $\xi=\xi(\omega)$ для такого эксперимента можно определить, например, как арифметическую сумму очков на выпавших гранях.  
\end{examp}

\mysubitem Пусть $X=\{x_1,x_2,\ldots,x_n\}$ есть множество всех значений, которые может принимать произвольная случайная величина $\xi$, и пусть 
$$
A=\{\omega\in \Omega:\,\,\xi(\omega)=x_k\}
$$
есть событие, заключающееся в том, что $\xi$ принимает заданное значение $x_k$. Вычислим для каждого $k=1,\ldots,n$ вероятность такого события
$$
\Pr(A)=\Pr(\xi=x_k)=\sum\limits_{\omega\colon\xi(\omega)=x_k}\Pr(\omega). 
$$
Тогда набор $\{\Pr(\xi=x_1),\Pr(\xi=x_2),\ldots,\Pr(\xi=x_n)\}$ называется \emph{распределением вероятностей} случайной величины $\xi$. Очевидно, что при любом исходе случайная величина какое-то значение обязательно примет. Как следствие, сумма всех вероятностей из данного набора обязана быть равной единице:
$$
\sum\limits_{k=1}^n\Pr(\xi=x_k)=1.
$$

Например, случайная величина $\xi$ из примера \ref{examp:dice_random} принимает $11$ возможных значений $x_k\in X$, $X=\{2,3,\ldots,12\}$, и распределение вероятностей значений $\xi$ здесь таково:
$$
\begin{array}{c|c|c|c|c|c|c|c|c|c|c|c}
\text{Значение $x_k$ случайной величины $\xi$:}\quad &2&3&4&5&6&7&8&9&10&11&12\\
\hline
\phantom{\dfrac{1}{1}}\text{Вероятность $\Pr(\xi=x_k)$:}&
\frac{1}{36}&\frac{2}{36}&\frac{3}{36}&\frac{4}{36}&\frac{5}{36}&\frac{6}{36}&\frac{5}{36}&\frac{4}{36}&\frac{3}{36}&\frac{2}{36}&\frac{1}{36}
\end{array}
$$

Отдельно взятая случайная величина $\xi$ полностью характеризуется множеством своих значений, а также распределением вероятностей этих значений. Детальная информация о структуре множества $\Omega$ всех элементарных событий нам в этом случае уже не важна. По сути, мы можем определить новое множество $\tilde\Omega=X$, множество $\mathcal B$ всех его подмножеств, и ввести на $(X,\mathcal B)$ вероятность $\Pr_{\xi}(B)$ по формуле
$$
\Pr_\xi(B)=\Pr(\xi\in B)=\sum\limits_{x_k\in B}\Pr(\xi=x_k).
$$ 
Тройка $(X,\mathcal B,\Pr_\xi)$ в этом случае полностью определяет нам соответствующую вероятностную модель, в которой событие вида ``случайная величина $\xi$ принимает заданное значение $x_k\in X$'' является элементарным событием.


\mysubitem Предположим теперь, что на одном и том же множестве $\Omega$ заданы две случайные величины $\xi_1$ и $\xi_2$. Для того, чтобы охарактеризовать их поведение, не зная ничего о структуре исходного вероятностного пространства, нам нужно, вообще говоря, задать их совместное распределение вероятностей, то есть сосчитать вероятности вида 
$$
\Pr(\xi_1=x_k\,\,\text{и}\,\,\xi_2=y_j)\qquad \qquad \text{для всех}\quad x_k\in X,\quad y_j\in Y.
$$
Иными словами, нам в данном случае в качестве множества значений нужно взять декартово произведение $X\times Y$ множества значений случайных величин $\xi_1$ и $\xi_2$, а затем определить вероятность для каждого элемента этого декартова произведения.

В общем случае сосчитать совместное распределение вероятностей непросто. Однако существует важный частный случай, когда вычисление этого распределения сводится к задаче вычисления распределения вероятности каждой отдельно взятой случайной величины. 

\begin{defin} 
Говорят, что $\xi_1$ и $\xi_2$ являются \emph{независимыми} случайными величинами, если
$$
\Pr(\xi_1=x_k\,\,\text{и}\,\,\xi_2=y_j)=\Pr(\xi_1=x_k)\cdot \Pr(\xi_2=y_j)\qquad \qquad \text{для всех}\quad x_k\in X,\quad y_j\in Y.
$$
\end{defin}

В более общем случае рассмотрим некоторый набор $\{\xi_1,\xi_2,\ldots,\xi_n\}$ случайных величин, заданных на одном и том же множестве $\Omega$ и принимающие значения в некотором конечном или счетном множестве $X$. 

\begin{defin} 
Случайные величины $\xi_1,\xi_2,\ldots,x_n$ называются \emph{независимыми (в совокупности)}, если для любых $x_1,x_2,\ldots,x_n\in X$ 
$$
\Pr(\xi_1=x_1,\xi_2=x_2,\ldots,\xi_n=x_n)=\Pr(\xi_1=x_1)\cdot \Pr(\xi_2=x_2)\cdot\ldots\cdot \Pr(\xi_n=x_n).
$$
\end{defin}

\mysubitem Простейший пример независимых в совокупности случайных величин можно получить, рассматривая описанную в конце первого параграфа схему Бернулли. Именно, пусть 
$$
\Omega=\{\omega:\,\,\,\omega=(a_1,a_2,\ldots,a_n),\quad a_i\in\{0,1\}\},\qquad\qquad
\Pr(\omega)=p^kq^{n-k},\quad k=\sum\limits_{i=0}^na_i.
$$
Мы заметили, что события вида
$$
B_1=\{\omega:\,\,a_1=1\},\qquad B_2=\{\omega:\,\,a_2=1\},\qquad \ldots\qquad B_n=\{\omega:\,\,a_n=1\}
$$
являются независимыми в совокупности. Введем множество $X=\{0,1\}$ и рассмотрим $n$ случайных величин вида $\xi_k(\omega)=a_k$, принимающих значения в этом множестве. Каждая такая случайная величина $\xi_k$ характеризует результат случайного испытания в схеме Бернулли на $k$-м шаге. Свойство независимости событий $B_k$ влечет тогда тот факт, что события $\xi_1,\ldots,\xi_n$ также являются независимыми в совокупности событиями. Кроме того, все эти $n$ случайных величин имеют одинаковое распределение вероятностей
$$
\Pr(\xi_k=1)=p,\qquad \qquad \Pr(\xi_k=0)=q.
$$
Введенная таким образом совокупность $\xi_1,\xi_2,\ldots,\xi_n$ независимых и одинаково распределенных случайных величин носит название последовательности бернулиевских случайных величин.

\mysubitem Рассмотрим еще несколько простых примеров независимых и зависимых случайных величин. 

\begin{examp} \label{examp:dice_random_2}
В примере \ref{examp:dice_random} мы можем ввести случайную величину $\xi_1$ как число очков на первом кубике, и случайную величину $\xi_2$ как количество очков на втором кубике. Ясно, что эти случайные величины являются независимыми.
\end{examp}

\begin{examp} \label{examp:dice_random_3}
В том же примере \ref{examp:dice_random} мы наряду с $\xi$ можем ввести случайную величину $\eta$ как произведение чисел, выпавших на двух кубиках. Распределение вероятностей данной случайной величины таково:
$$
\begin{array}{c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c}
\phantom{\dfrac{|}{|}}\text{Значение $y_j$:}\quad &1&2&3&4&5&6&8&9&10&12&15&16&18&20&24&25&30&36\\
\hline
\phantom{\dfrac{|}{|}}\text{$\Pr(\eta=y_j)$:}&
\frac{1}{36}&\frac{2}{36}&\frac{2}{36}&\frac{3}{36}&\frac{2}{36}&\frac{4}{36}&\frac{2}{36}&\frac{1}{36}&\frac{2}{36}&\frac{4}{36}&\frac{2}{36}&\frac{1}{36}&\frac{2}{36}&\frac{2}{36}&\frac{2}{36}&\frac{1}{36}&\frac{2}{36}&\frac{1}{36}
\end{array}
$$
Случайные величины $\xi$ и $\eta$ независимыми уже не являются. Это видно и чисто интуитивно: если нам сказали, что $\xi=2$, то мы тут же можем сказать, что $\eta=1$. Для формального доказательство данного факта достаточно, например, заметить, что произведение вероятностей $\Pr(\xi=x_k)$ и $\Pr(\eta=y_j)$ для любых допустимых значений $x_k$ и $y_j$ строго больше нуля, тогда как вероятность того, что $\xi=x_k$ и одновременно $\eta=y_j$, достаточно часто равна нулю --- например, если $x_k=2$, а $y_j>1$.  
\end{examp}

\mysubitem Вернемся к примеру \ref{examp:dice_random_2}. Понятно, что любое значение случайной величины $\xi$ из примера \ref{examp:dice_random} представляет собой сумму значений случайных величин $\xi_1$ и $\xi_2$. Возникает вопрос --- возможно ли по известным распределениям вероятностей случайных величин $\xi_1$ и $\xi_2$ вычислить распределение вероятностей случайной величины $\xi$. 

Итак, предположим, что мы имеем пару случайных величин $\xi_1$ и $\xi_2$, таких, что $\xi_1$ принимает значения из множества $X=\{x_1,x_2,\ldots,x_n\}$, а $\xi_2$ --- из множества $Y=\{y_1,y_2,\ldots,y_m\}$. Введем новую случайную величину $\xi$ как арифметическую сумму случайных величин $\xi_1$ и $\xi_2$. Ясно, что случайная величина $\xi=\xi_1+\xi_2$ принимает значения из множества 
$$
Z=\{z:\,\,z=x_k+y_j,\quad k=1,2,\ldots,n,\quad j=1,2,\ldots,m\}.
$$
Распределение же вероятностей случайной величины $\xi$ выражается через совместное распределение вероятностей случайных величин $\xi_1$ и $\xi_2$:
$$
\Pr(\xi=z)=\Pr(\xi_1+\xi_2=z)=\sum\limits_{(k,j):\,x_k+y_j=z}\Pr(\xi_1=x_k\,\,\,\text{и}\,\,\,\xi_2=y_j).
$$
Теперь понятно, что в случае, когда случайные величины $\xi_1$ и $\xi_2$ являются независимыми, последнее соотношение можно упростить и выразить распределение вероятностей $\xi$ через известные распределения вероятностей случайных величин $\xi_1$ и $\xi_2$:
$$
\Pr(\xi=z)=\Pr(\xi_1+\xi_2=z)=\sum\limits_{(k,l):\,x_k+y_j=z}\Pr(\xi_1=x_k)\cdot \Pr(\xi_2=y_j)=
\sum\limits_{k=1}^n\Pr(\xi_1=x_k)\cdot \Pr(\xi_2=z-x_k).
$$
В последней сумме вероятность $\Pr(\xi_2=z-x_k)$ считается равной нулю, если $z-x_k\notin Y$. 

Рассмотрим в качестве примера случайную величину $\xi=\xi_1+\xi_2$, где $\xi_1$, $\xi_2$ есть пара независимых бернуллиевских случайных величин. В этом случае $Z=\{0,1,2\}$, а распределение вероятностей случайной величины $\xi$ описывается следующими соотношениями:
$$
\Pr(\xi=0)=\Pr(\xi_1=0)\cdot \Pr(\xi_2=0)=q\cdot q=q^2,
$$
$$
\Pr(\xi=1)=\Pr(\xi_1=0)\cdot \Pr(\xi_2=1)+\Pr(\xi_1=1)\cdot \Pr(\xi_2=0)=2\,p\,q,
$$
$$
\Pr(\xi=2)=\Pr(\xi_1=1)\cdot \Pr(\xi_2=1)=p\cdot p=p^2.
$$

Аналогичные рассуждения справедливы и в случае, когда мы имеем сумму $n$ случайных величин. Так, в случае $n$ независимых бернуллиевских случайных величин $\xi_1,\xi_2,\ldots,\xi_n$ случайная величина $\xi=\xi_1+\xi_2+\ldots+\xi_n$,  принимающая значения из множества $Z=\{0,1,\ldots,n\}$, описывает количество успехов и неудач в схеме Бернулли. Распределение вероятностей этой случайной величины совпадает с биномиальным распределением:
$$
\Pr(\xi=k)=\BCf{n}{k}p^kq^{n-k}.
$$
Здесь $\Pr(\xi=k)$ есть, по смыслу задачи, вероятность выбросить ровно $k$ решек при $n$ бросаниях монетки. 
Данную формулу можно доказать и по индукции, однако далее мы приведем значительно более простой ее вывод с помощью аппарата производящих функций. 

\myitem Перейдем теперь к таким важным характеристикам случайной величины, как математическое ожидание и дисперсия.

\mysubitem Рассмотрим произвольный случайный эксперимент. Предположим, что на множестве $\Omega$ элементарных исходов этого случайного эксперимента задана случайная величина $\xi$, принимающая значения из множества $X$, $|X|=n$. Будем повторять этот случайный эксперимент $N$ раз, и следить за значениями, которые принимает случайная величина $\xi$ в этих экспериментах. Интуитивно ясно, что каждое значение $x_k\in X$ случайной величины $\xi$ появляется в этих испытаниях $N\cdot p_k$ раз, где $p_k=\Pr(\xi=x_k)$. Тогда среднее значение, которое принимает случайная величина $\xi$ в результате $N$ случайных экспериментов, должно быть примерно равно
$$
\dfrac{1}{N}[N\,p_1\,x_1+N\,p_2\,x_2+\ldots+N\,p_n\,x_n]=
\sum\limits_{k=1}^np_k\cdot x_k.
$$
Данные рассуждения приводят нас к следующему определению.

\begin{defin} Математическим ожиданием или средним значением случайной величины $\xi$ называется сумма вида
\begin{equation}
\label{eq:math_expect}
\EV(\xi)=\sum\limits_{k=1}^np_k\cdot x_k.
\end{equation}
\end{defin}

\begin{examp} Колесо рулетки имеет равномерно расположенные по колесу ячейки, которые обозначены числами от $0$ до $36$. Предположим, что игрок ставит на некоторое число сумму, равную одному доллару. Если эта цифра выигрывает, то он получает $36$ долларов, если проигрывает --- то не получает ничего. Пусть $\xi$ есть случайная величина, равная количеству денег, которые игрок выигрывает. Подсчитаем, сколько денег в среднем за $n$ испытаний игрок может получить обратно.

Для этого заметим, что множество $X$ возможных значений в данном случайном эксперименте есть $X=\{0,36\}$. Первое значение случайная величина $\xi$ принимает с вероятностью, равной $36/37$, а второе --- с вероятностью $1/37$. Следовательно, по формуле (\ref{eq:math_expect}) имеем
$$
\EV(\xi)=36\cdot \dfrac{1}{37}+0\cdot \dfrac{36}{37}=\dfrac{36}{37}=0.973.
$$
Как видим, в среднем за каждую попытку игрок теряет $0.027$ долларов.   
\end{examp}

\mysubitem Поговорим теперь об основных свойствах математического ожидания. Прежде всего, заметим, что иногда нам все же полезно вспомнить об исходном вероятностном пространстве $(\Omega,\mathcal A,\Pr)$ и переписать формулу (\ref{eq:math_expect}) в следующем эквивалентном виде:
\begin{equation}
\label{eq:math_expect_omega}
\EV(\xi)=\sum\limits_{\omega\in\Omega}\xi(\omega)\,\Pr(\omega).
\end{equation}
Действительно, для всех $\omega$, для которых $\xi(\omega)=x_k$, имеем
$$
\sum\limits_{\omega: \,\,\xi(\omega)=x_k}\Pr(\omega)=\Pr(\xi=x_k),
$$
и мы от (\ref{eq:math_expect_omega}) приходим к (\ref{eq:math_expect}). 

Пусть у нас теперь имеются две произвольные случайные величины $\xi_1$ и $\xi_2$, определенные на одном и том же вероятностном пространстве  $(\Omega,\mathcal A,\Pr)$. В этом случае, согласно формуле (\ref{eq:math_expect_omega}), математическое ожидание суммы $\xi=\xi_1+\xi_2$ этих двух случайных величин равно сумме математических ожиданий $\EV(\xi_1)$ и $\EV(\xi_2)$:
$$
\EV(\xi_2+\xi_2)=\sum\limits_{\omega\in\Omega}(\xi_1(\omega)+\xi_2(\omega))\,\Pr(\omega)=\EV(\xi_1)+\EV(\xi_2).
$$
Данное равенство выражает собой свойство линейности математического ожидания.

В случае произведения случайных величин простая формула, связывающая математическое ожидание $\EV(\xi_1\cdot\xi_2)$ с математическими ожиданиями $\EV(\xi_1)$ и $\EV(\xi_2)$, имеет место лишь в том случае, когда $\xi_1$ и $\xi_2$ являются независимыми случайными величинами. В этом случае
$$
\EV(\xi_1\cdot\xi_2)=\EV(\xi_1)\cdot \EV(\xi_2).
$$
Действительно,
$$
\EV(\xi_1\cdot\xi_2)=\sum\limits_{\omega\in\Omega}\xi_1(\omega)\,\xi_2(\omega)\,\Pr(\omega)=
\sum\limits_{k,j}x_k y_j\,\Pr(\xi_1=x_k\,\,\text{и}\,\,\xi_2=y_j)=
$$
$$
=\sum\limits_{k,j}x_k y_j\,\Pr(\xi_1=x_k)\,\Pr(\xi_2=y_j)=
\sum\limits_{k}x_k \Pr(\xi_1=x_k)\cdot \sum\limits_{j}y_j\,\Pr(\xi_2=y_j)=\EV(\xi_1)\cdot \EV(\xi_2).
$$

Так, несложно убедиться, математические ожидания случайных величин $\xi_1$ и $\xi_2$ из примера \ref{examp:dice_random_2} одинаковы и равны $\EV(\xi_1)=\EV(\xi_2)=7/2$. Следовательно, математическое ожидание $\EV(\xi)$ случайной величины $\xi=\xi_1+\xi_2$ из примера \ref{examp:dice_random} равно $7$, а математическое ожидание $\EV(\eta)$ случайной величины $\eta=\xi_1\cdot \xi_2$ из примера \ref{examp:dice_random_3} равно $49/4$. 

Для любой из $n$ бернуллиевских случайных величин $\xi_1,\xi_2,\ldots,\xi_n$ математическое ожидание $\EV(x_k)$ равно, очевидно, $p$. Следовательно, математическое ожидание случайной величины 
$$
\xi=\xi_1+\xi_2+\ldots+\xi_n
$$
оказывается равным $\EV(\xi)=n\cdot p$. 

\mysubitem Перейдем теперь к понятию дисперсии $\VR(\xi)$ случайной величины $\xi$. Она характеризует степень разброса значений $\xi$ относительно ее математического ожидания и определяется как средний квадрат отклонения от среднего:
$$
\VR(\xi):=\EV((\xi-\EV(\xi))^2).
$$
Так как
$$
\EV((\xi-\EV(\xi))^2)=\EV(\xi^2-2\xi\EV(\xi)+(\EV(\xi))^2)=\EV(\xi^2)-2\EV(\xi)\cdot\EV(\xi)+(\EV(\xi))^2,
$$
то 
\begin{equation}
\label{eq:variance_calc}
\VR(\xi)=\EV(\xi^2)-(\EV(\xi))^2.
\end{equation}
Далее, с использованием последней формулы несложно проверяется, что в случае независимых случайных величин $\xi_1$ и $\xi_2$ дисперсия их суммы равна сумме их дисперсий:
$$
\VR(\xi_1+\xi_2)=\VR(\xi_1)+\VR(\xi_2).
$$
Так, в примере \ref{examp:dice_random_2} для дисперсии случайной величины $\xi_1$ согласно (\ref{eq:variance_calc}) имеем
$$
\VR(\xi_1)=\dfrac{1}{6}(1^2+2^2+3^2+4^2+5^2+6^2)-\left(\dfrac{7}{2}\right)^2=\dfrac{35}{12},
$$
поэтому дисперсия случайной величины $\xi$ из примера \ref{examp:dice_random} равна
$$
\VR(\xi)=\dfrac{35}{12}+\dfrac{35}{12}=\dfrac{35}{6}.
$$
В случае бернуллиевской случайной величины $\xi_1$, принимающей два значения $0$ и $1$ с вероятностями $q$ и $p$ соответственно, 
$$
\VR(\xi_1)=\EV(\xi_1^2)-(\EV(\xi_1))^2=(p\cdot 1^2+q\cdot 0^2)-p^2=p-p^2=p(1-p)=pq.
$$
Как следствие, если $\xi_1,\xi_2,\ldots,\xi_n$ есть последовательность бернуллиевских случайных величин и $\xi$ есть их сумма, то $\VR(\xi)=npq$.

\mysubitem Теперь мы можем более строго обосновать тот факт, что дисперсия есть мера разброса случайной величины $\xi$. 

\begin{lemm} Для любого вещественного $\alpha>0$ справедливо неравенство
\begin{equation}
\label{eq:Cheb_ineq}
\Pr\left((\xi-\EV(\xi))^2\geq \alpha\right)\leq\dfrac{\VR(\xi)}{\alpha},
\end{equation}
называемое неравенством Чебышева.
\end{lemm}

\evidp Обозначим через $\mu:=\EV(\xi)$. По определению,
$$
\VR(\xi)=\EV((\xi-\mu)^2)=\sum\limits_{\omega\in \Omega}\Pr(\omega)\,(\xi(\omega)-\mu)^2\geq
\sum\limits_{\omega\in \Omega:\,(\xi(\omega)-\mu)^2\geq \alpha}\Pr(\omega)\,(\xi(\omega)-\mu)^2\geq
$$
$$
\geq \sum\limits_{\omega\in \Omega:\,(\xi(\omega)-\mu)^2\geq \alpha}\Pr(\omega)\cdot\alpha=\alpha
\cdot \Pr\left((\xi-\mu)^2\geq \alpha\right).
$$
\qed

Смысл данного неравенства следующий: в случае, если дисперсия случайной величины $\xi$ мала, то $\xi$ в большинстве случаев принимает значения, близкие к своему среднему значению $\mu$. 

Часто неравенство (\ref{eq:Cheb_ineq}) записывают несколько в ином виде. Введем наряду с $\VR(\xi)$ так называемое стандартное отклонение $\sigma=\sqrt{\VR(\xi)}$ случайной величины $\xi$ и перейдем от параметра $\alpha$ к новому параметру $c$ по формуле $\alpha=c^2\VR(\xi)=c^2\sigma^2$. Условие $(\xi-\mu)^2\geq \alpha$ в этом случае принимает вид
$(\xi-\mu)^2\geq c^2\sigma^2$, что равносильно тому, что $|\xi-\mu |\geq c\sigma$. В результате неравенство можно переписать так:
$$
\Pr\left(|\xi-\mu |\geq c\sigma\right)\leq\dfrac{1}{c^2}.
$$
Последнее неравенство можно трактовать следующим образом: $\xi$ лежит в пределах своего $c$-кратного стандартного отклонения $\sigma$ от своего среднего значения $\mu$, за исключением случаев, вероятность которых не превышает $1/c^2$. Например, в случае $c=2$ имеем $1/c^2=0.25$, и поэтому отклонение случайной величины $\xi$ от $\mu$ не превосходит $2\sigma$ по крайней мере для $75\%$ испытаний. В случае $c=10$ этот процент возрастает до $99\%$. 


\myitem В частном, но достаточно распространенном на практике случае, когда случайная величина $\xi$ принимает только целые неотрицательные значения, мы можем для анализа ее поведения использовать аппарат производящих функций. 

\mysubitem Пусть множество $X$ значений случайной величины $\xi$ есть подмножество множества $\Z_+$. Тогда мы можем ввести формальный степенной ряд вида
$$
P(z)=\sum\limits_{n\in \Z_+}\Pr(\xi=n)\cdot z^n,
$$
называемый \emph{производящей функцией} случайной величины $\xi$. По смыслу чисел $\Pr(\xi=n)$, коэффициенты при $z^n$ указанной производящей функции неотрицательны, а сумма всех этих коэффициентов равна единице. Формально данное условие можно записать так:
$$
P(1)=\sum\limits_{n\in \Z_+}\Pr(\xi=n)=1.
$$
Обратно, любой формальный степенной ряд с неотрицательными коэффициентами, сумма которых равна единице, можно трактовать как производящую функцию для некоторой случайной величины $\xi$. 

\mysubitem Использование производящих функций сильно упрощает вычисление математического ожидания, дисперсии и других характеристик случайных величин. Действительно, по определению,
$$
\EV(\xi)=\sum\limits_{n\in \Z_+}n\cdot \Pr(\xi=n)=\sum\limits_{n\in \Z_+}\Pr(\xi=n)\cdot \left.n\,z^{n-1}\right|_{z=1}=P'_z(1).
$$
Для вычисления дисперсии заметим, что
$$
\EV(\xi^2)=\sum\limits_{n\in \Z_+}n^2\cdot \Pr(\xi=n)=\sum\limits_{n\in \Z_+}\Pr(\xi=n)\cdot 
\left.\left(n\,(n-1)\,z^{n-2}+n\,z^{n-1}\right)\right|_{z=1}=P''_z(1)+P'_z(1),
$$
и поэтому в соответствии с формулой (\ref{eq:variance_calc}) имеем
$$
\VR(\xi)=P''_z(1)+P'_z(1)-(P'_z(1))^2.
$$
Математическое ожидание и дисперсия являются первыми двумя из бесконечного ряда так называемых кумулянтов, выражающих довольно тонкие свойства распределения случайных величин. С помощью производящих функций можно получить общие соотношения для кумулянтов любого порядка (смотри, например, \cite{Grah_Knut_Pat}).

\mysubitem Пусть $\xi_1$ и $\xi_2$ --- пара \emph{независимых} случайных величин, принимающих только лишь целочисленные значения, а $P_1(z)$ и $P_2(z)$ --- соответствующие им производящие функции. Рассмотрим случайную величину $\xi$, равную сумме $\xi_1$ и $\xi_2$. Оказывается, что производящая функция $P(z)$ для такой случайной величины представляет собой произведение производящих функций $P_1(z)$ и $P_2(z)$:
$$
\xi=\xi_1+\xi_2,\qquad \text{$\xi_1,\xi_2$ --- независимые}\qquad \Longrightarrow\qquad P(z)=P_1(z)\cdot P_2(z).
$$
Действительно, по определению,
$$
\Pr(\xi_1+\xi_2=n)=\sum\limits_{k=0}^n\Pr(\xi_1=k\,\,\text{и}\,\,\xi_2=n-k)=\sum\limits_{k=0}^n\Pr(\xi_1=k)\cdot\Pr(\xi_2=n-k).
$$
Последнее же выражение представляет собой не что иное, как свертку соответствующих числовых последовательностей.

Мы уже знаем, что математическое ожидание $\xi$ равно сумме математических ожиданий $\xi_1$ и $\xi_2$. Посмотрим, как это свойство получается в терминах производящих функций:
$$
P'(z)=P'_1(z)\cdot P_2(z)+P_1(z)\cdot P'_2(z).
$$
Учитывая теперь, что $P_1(1)=P_2(1)=1$, мы и получаем, что
$$
\EV(\xi)=P'(1)=P'_1(1)+P'_2(1)=\EV(\xi_1)+\EV(\xi_2).
$$
Аналогично с помощью производящих функций проверяется, что и дисперсия суммы случайных величин $\xi_1$ и $\xi_2$ равна сумме дисперсий $\VR(\xi_1)$ и $\VR(\xi_2)$. 


\mysubitem В качестве первого примера рассмотрим производящую функцию для случайной величины $\xi_1$, описывающей распределение количества очков на одном правильном кубике (пример \ref{examp:dice_random_2}). В этом случае
$$
P_1(z)=\dfrac{1}{6}(z+z^2+z^3+z^4+z^5+z^6)=\dfrac{z(1-z^6)}{6(1-z)}.
$$
Несмотря на компактный вид стоящего в правой части данного равенства выражения, оно оказывается не слишком удобным --- подстановка как в само это выражение, так и в его производные значения $z=1$ дает неопределенность $0/0$. Вместо столь прямых способов более разумно перейти в этом выражении к новой переменной $t$ по формуле $z=1+t$ и разложить полученное выражение по степеням $t$ с использованием бинома Ньютона:
$$
P_1(1+t)=\dfrac{(1+t)^7-(1+t)}{6t}=\dfrac{1}{6}\left[\BCf{7}{1}+\BCf{7}{2}t+\BCf{7}{3}t^2+\ldots+\BCf{7}{7}t^6-1\right].
$$
Как следствие,
$$
P_1(t=0)=\dfrac{1}{6}\left[\BCf{7}{1}-1\right]=1,\qquad P'_1(t=0)=\dfrac{1}{6}\BCf{7}{2}=\dfrac{7}{2}=\EV(\xi_1),\qquad P''_1(t=0)=\dfrac{35}{3},
$$
откуда $\VR(\xi_1)=35/12$. 

Наконец, зная $P_1(z)$, можно сосчитать производящую функцию и для случайной величины $\xi$ из примера \ref{examp:dice_random}: 
$$
P(z)=P_1^2(z)=\dfrac{z^2+2z^3+3z^4+4z^5+5z^6+6z^7+5z^8+4z^9+3z^{10}+2z^{11}+z^{12}}{36}.
$$

\mysubitem Рассмотрим теперь последовательность $\xi_1,\xi_2,\ldots,\xi_n$ бернуллиевских случайных величин, а также случайную величину $\xi=\xi_1+\xi_2+\ldots+\xi_n$. Производящая функция для любой из $\xi_k$ имеет вид 
$$
H(z)=q+pz,
$$
поэтому производящая функция для $\xi$ имеет вид
$$
H^n(z)=(q+pz)^n=\sum\limits_{k=0}^n\BCf{n}{k}p^kq^{n-k}z^k.
$$
Это и есть обещанное доказательство того, что распределение вероятностей случайной величины $\xi$ совпадает с биномиальным распределением. 

Вычислим вновь математическое ожидание и дисперсию случайной величины $\xi$, но на этот раз сделаем это с помощью производящей функции:
$$
\EV(\xi)=\left.\od{(q+pz)^n}{z}\right|_{z=1}=n\cdot (q+p)^{n-1}\cdot p=n\,p;
$$
$$
\VR(\xi)=\left.\left[\odd{(q+pz)^n}{z}+\od{(q+pz)^n}{z}\left(1-\od{(q+pz)^n}{z}\right)\right]\right|_{z=1}=n(n-1)p^2+np(1-np)=npq.
$$


\section*{Упражения}
\begin{exerc} 
Колесо рулетки в равномерно расположенных ячейках имеет числа от $0$ до $36$. Ячейки с чётными номерами в диапазоне от $2$ до $36$ окрашены в черный цвет, ячейки с нечетными номерами в диапазоне от $1$ до $36$ окрашены в красный цвет. Игрок платит доллар и выбирает цвет. Если игрок выигрывает, то он получает два доллара, если проигрывает, то не получает ничего. Найти математическое ожидание случайной величины, равной выигрышу игрока.
\end{exerc}

\begin{exerc} 
Восемь шаров, пронумерованных числами $0,1,1,2,2,2,5$ и $10$ соответственно, помещены в урну. Игрок вытягивает три из них и получает выигрыш в сумме, равной сумме чисел на трех шарах. Каково математическое ожидание выигрыша в такой игре?  
\end{exerc}

\begin{exerc} 
Предположим, что игральным картам присвоены следующие стоимости: туз имеет стоимость, равную одному доллару, двойка~--- $2$ доллара, \dots , десятка~--- $10$ долларов, валет~--- $11,$ дама~--- $12,$ король~--- $13.$ Игрок вытягивает одну карту. В случае, если эта карта бубновой масти, игрок получает её стоимость. Если червовой, то ее стоимость удваивается. Если карта чёрной масти, то игрок платит $10$ долларов. Чему равно математическое ожидание выигрыша?
\end{exerc}

\begin{exerc} 
Верно ли, что если $\xi$ и $\eta$~--- независимые случайные величины, то таковыми являются также $f(\xi)$ и $g(\eta)$, где $f$ и $g$~--- произвольные функции?
\end{exerc}

\begin{exerc} 
Построить случайную величину, имеющую конечное математическое ожидание и бесконечную дисперсию.
\end{exerc}

\begin{exerc} 
{\it Смесью} распределений, описываемых производящими функциями $F(z)$ и $G(z)$, называется новое распределение, производящая функция для которого равна 
$$
H(z) = p\cdot F(z) + q \cdot G(z),\quad p+q=1.
$$
Выразить математическое ожидание и дисперсию распределения $H(z)$ через математические ожидания и дисперсии распределений $F(z)$ и $G(z)$.
\end{exerc}

\begin{exerc} 
Говорят, что случайная величина $X$ имеет {\it распределение Пуассона} с параметром $\mu$, если 
$$
\Pr(X = n) = \frac {e^{-\mu} \cdot \mu^n}{n!}.
$$
Найти производящую функцию для этой случайной величины. Вычислить её математическое ожидание и дисперсию.
\end{exerc}

\begin{exerc}
Две независимые случайные величины $\xi_1$ и $\xi_2$ имеют распределения Пуассона с параметрами $\mu_1$ и $\mu_2$ соответственно. Найти производящую функцию случайной величины $2\cdot \xi_1 + 3 \cdot \xi_2$, вычислить ее математическое ожидание и дисперсию.
\end{exerc}

\begin{exerc} 
На гранях кубика вместо меток $1,2,3,4,5 \text{ и } 6$ нанесены метки $1,3,4,5,6,8$. Расставьте метки на гранях второго кубика так, чтобы распределение суммы очков при бросании двух этих кубиков было таким же, как и для случая бросания двух обычных кубиков.
\end{exerc}


\section*{Решение упражнений}
\begin{sol_exerc}
Вероятность выигрыша составляет $\frac{18}{37}$, а вероятность проигрыша равна, соответственно, $\frac{19}{37}$. Пусть $\xi$~--- случайная величина, равная выигрышу в игре. Тогда
$$
\EV(\xi)=2\cdot  \frac{18}{37} + 0 \cdot  \frac{19}{37} =  \frac{36}{37} = 0.973.
$$ 
Таким образом, в среднем за игру игрок теряет $0.027$ доллара.
\end{sol_exerc}

\begin{sol_exerc}
Пусть $\xi_1, \xi_2, \xi_3$~--- случайные величины, значения которых совпадает с числами на вытянутых шарах. Эти случайные величины принимают значения из одного и того же множества чисел, поэтому
$$
\EV(\xi_1)=\EV(\xi_2)=\EV(\xi_3)=\frac{0}{8}+\frac{1}{8}+\frac{1}{8}+\frac{2}{8}+\frac{2}{8}+\frac{2}{8}+\frac{5}{8}+\frac{10}{8}=\frac{23}{8}
$$
Теперь остается воспользоваться линейностью математического ожидания:
$$
\EV(\xi_1+\xi_2+\xi_3)=\EV(\xi_1)+\EV(\xi_2)+\EV(\xi_3)=3\cdot \EV(\xi_1)=\frac{69}{8}.
$$
\end{sol_exerc}

\begin{sol_exerc}
Пусть $\xi$ есть случайная величина, равная выигранной сумме. По определению математического ожидания,
$$
\EV(\xi)=\frac{1}{52}+\frac{2}{52}+\frac{3}{52}+\dots+\frac{13}{52}+ \frac{2\cdot 1}{52}+\frac{2\cdot 2}{52}+\frac{2\cdot 3}{52}+\dots+\frac{2\cdot 13}{52}-10\cdot \frac{1}{2}= 
$$
$$
=3\cdot \frac{13 \cdot 14}{2} \cdot \frac{1}{52} - 5  = 5.25-5=0.25.
$$
\end{sol_exerc}

\begin{sol_exerc}
Да, это верно. Действительно, покажем, что для любых $f_k \in \Im(f) $ и $g_m \in \Im(g)$ справедливо равенство  
$$
\Pr(f(\xi)=f_k)\cdot \Pr(g(\eta)=g_m) =\Pr(f(\xi)=f_k \text{ и } g(\eta)=g_m).
$$
Обозначим через $X_k=\{x_i\mid f(x_i)~=~f_k\}$ и $Y_m=\{y_j\mid g(y_i)~=~g_m\}$ множество всех прообразов значений $f_k$ и $g_m$ функций $f(\xi)$ и $g(\eta)$. Можно записать, что
$$
\Pr(f(\xi)=f_k)\cdot \Pr(g(\eta)=g_m) = \Pr(\xi \in X_k)\cdot \Pr(\eta \in Y_m) =
$$
$$
= \sum_{x_i \in X_k} \Pr(\xi = x_i) \cdot \sum_{y_j \in Y_m} \Pr(\eta = y_j) = \sum_{(x_i,y_j) \in X_k \times Y_m} \Pr(\xi = x_i)\cdot \Pr(\eta = y_j).
$$
Теперь воспользуемся независимостью случайных величин $\xi$ и $\eta$:
$$
\sum_{(x_i,y_j) \in X_k \times Y_m} \Pr(\xi = x_i)\cdot \Pr(\eta = y_j) = 
\sum_{(x_i,y_j) \in X_k \times Y_m} \Pr(\xi = x_i \text{ и } \eta = y_j) = 
$$
$$
= \Pr(\xi \in X_k \text{ и } \eta \in Y_m) = \Pr(f(\xi)=f_k \text{ и } g(\eta)=g_m).
$$
Таким образом, случайные величины $f(\xi)$ и $g(\eta)$ также независимы.
\end{sol_exerc}


\begin{sol_exerc}
Приведём пример такого распределения, воспользовавшись методом производящих функций. Так как $E(\xi)=P'_z(1)$, а $\VR(\xi)=P''_z(1)+P'_z(1)-(P'_z(1))^2$, то можно попытаться подобрать такую производящую функцию, чтобы её первая производная, вычисленная в единице, была конечной, а вторая обращалась в бесконечность. Для этого нам достаточно выбрать $P(z)$ так, чтобы ряд $P''_z(1)$ расходился.

Например, рассмотрим следующую производящую функцию: 
$$
F(z)=\sum_{n \geq 3}\frac{z^n}{n(n-1)(n-2)}.
$$
Её первая производная в точке 1 равна $\sum_{n \geq 2}\frac{1}{n(n-1)}$, и этот ряд, очевидно, сходится. Вторая производная указанного ряда в точке $z=1$ равна $\sum_{n \geq 1}\frac{1}{n}$, и такой ряд уже расходится. 

Осталось отнормировать функцию $F(z)$. Можно показать, что 
$$
\sum_{n \geq 3}\frac{1}{n(n-1)(n-2)}=\frac{1}{4}.
$$
Разделив $F(z)$ на $1/4$, мы получим искомое выражение для распределения случайной величины, имеющей конечное математическое ожидание и бесконечную дисперсию:
$$
\Pr(\xi=n)=\frac{4}{n(n-1)(n-2)}\qquad \text { для всех } \quad n \geq 3.
$$
\end{sol_exerc}


\begin{sol_exerc}
Пусть распределения вероятностей случайных величин $\xi$, $\eta$ и $\zeta$ описываются производящими функциями $F(z)$, $G(z)$ и $H(z)$ соответственно. Очевидным следствием линейности математического ожидания является тот факт, что
$$
\EV(\zeta)=p\cdot \EV(\xi) + (1-p) \cdot \EV(\eta).
$$
Запишем формулу для вычисления дисперсии случайной величины $\zeta$:
$$
\VR(\zeta)=H''_z(1)+H'_z(1)-(H'_z(1))^2 = 
$$
$$
= p\cdot (F''_z(1) + F'_z(1)) + q\cdot (G''_z(1)+G'_z(1)) - p^2 \cdot F'_z(1)^2 - q^2 \cdot G'_z(1)^2 - 2pq \cdot F'_z(1) \cdot G'_z(1).
$$
Прибавим и вычтем из получившегося выражения величину $p \cdot F'_z(1)^2 + q\cdot G'_z(1)^2$. В результате получим, что
$$
\VR(\zeta)  = p\cdot \VR(\xi)+q \cdot \VR(\eta) + (p - p^2) \cdot F'_z(1)^2 + (q - q^2) \cdot G'_z(1)^2 - 2pq \cdot F'_z(1) \cdot G'_z(1).
$$
Так как $q=1-p$, то последнее равенство можно переписать так:
$$
\VR(\zeta) = p\cdot \VR(\xi)+q \cdot \VR(\eta) + (p - p^2) \cdot F'_z(1)^2 + (p - p^2) \cdot G'_z(1)^2 - 2(p-p^2) \cdot F'_z(1) \cdot G'_z(1) = 
$$
$$
= p\cdot \VR(\xi)+(1-p) \cdot \VR(\eta) + (p - p^2) \cdot (\EV(\xi) - \EV(\eta))^2.
$$
\end{sol_exerc}

\begin{sol_exerc}
Производящая функция для описанной в упражнении случайной величины $\xi$ равна
$$
P(z)=\sum_{n \geq 0} \frac {e^{-\mu} \cdot \mu^n}{n!} \cdot z^n = e^{-\mu} \sum_{n \geq 0} \frac {(\mu \cdot z) ^ n}{n!} = e^{-\mu}\cdot e^{\mu \cdot z} = e ^ {\mu \cdot (z - 1)}.
$$
Следовательно,
$$
P'(z) = \mu \cdot e ^ {\mu \cdot (z - 1)} \qquad\Longrightarrow\qquad \EV(\xi) = \mu \cdot e ^ {\mu \cdot (1 - 1)} = \mu.
$$
$$
P''(z) = {\mu}^2 \cdot e ^ {\mu \cdot (z - 1)} \qquad\Longrightarrow\qquad \VR(\xi) = \mu^2 + \mu - \mu^2 = \mu.
$$
\end{sol_exerc}

\begin{sol_exerc}
Обозначим производящие функции для случайных величин $\xi_1$ и $\xi_2$ через $P_1(z)$ и $P_2(z)$ соответственно. Используя полученный в предыдущем упражнении результат, мы можем записать, что
$$
P_1(z) = e ^ {\mu_1 \cdot (z - 1)},\qquad P_2(z)=e ^ {\mu_2 \cdot (z - 1)}.
$$
Заметим, что с помощью производящей функции $P(z)$ для случайной величины $\xi$ мы можем вычислить производящую функцию $P_k(z)$ для случайной величины $k\cdot \xi$:
$$
P_k(z) = \sum_{n \geq 0} \Pr(k\cdot \xi = n) \cdot z^n = \sum_{n \in \{0, k, 2k, \dots \}} \Pr(\xi = n / k) \cdot z^n.
$$
Заменив в этом выражении $n / k$ на $m$, получим, что
$$
P_k(z)  =  \sum_{m \geq 0} \Pr(\xi = m) \cdot z^{m\cdot k} = P(z^k).
$$
Используя этот факт, получаем, что производящая функция $F(z)$ для случайной величины $2\cdot \xi_1 + 3 \cdot \xi_2$ равна
$$
F(z) = e ^ {\mu_1 \cdot (z^2 - 1)} \cdot e ^ {\mu_2 \cdot (z^3 - 1)} = e ^ {\mu_1 \cdot (z^2 - 1) + \mu_2 \cdot (z^3 - 1)}.
$$
Для вычисления математического ожидания и дисперсии вычислим производные этой функции:
$$
F'(z) = (2 \mu_1 z + 3 \mu_2 z^2) \cdot e ^ {\mu_1 \cdot (z^2 - 1) + \mu_2 \cdot (z^3 - 1)},
$$
$$
F''(z) = ((2 \mu_1 z + 3 \mu_2 z^2)^2 + 2 \mu_1 + 6 \mu_2 z) \cdot e ^ {\mu_1 \cdot (z^2 - 1) + \mu_2 \cdot (z^3 - 1)}. 
$$
Следовательно,
$$
\EV(2\cdot X_1 + 3 \cdot X_2) = F'(1)=2 \mu_1 + 3 \mu_2; \qquad \VR(2\cdot X_1 + 3 \cdot X_2) = F''(1)=4 \mu_1 + 9 \mu_2.
$$
\end{sol_exerc}

\begin{sol_exerc}
Распределение суммы значений при бросании двух обычных кубиков задаётся производящей функцией
$$
F(z) = \dfrac{(z + z^2+z^3+z^4+z^5+z^6)^2}{36}.
$$
В случае кубиков, описанных в данном упражнении, мы должны получить то же самое распределение суммы двух значений. С формальной точки зрения это означает, что 
$$
F(z) = G(z) \cdot \frac{1}{6} (z+z^3+z^4+z^5+z^6 + z^8),
$$
где $G(z)$ --- производящая функция, описывающая распределение вероятностей искомого в упражнении кубика. 
Выражая из этого уравнения функцию $G(z),$ мы получаем, что
$$
G(z) = \frac{1}{6} (z + 2z^2 + 2z^3+z^4).
$$
Следовательно, на грани искомого кубика нужно нанести метки $1,2,2,3,3$ и $4$.
\end{sol_exerc}

\section{Цепи Маркова}

\myitem Вновь вернемся к классической схеме о подбрасывании монетки. Ранее мы подробно разобрали задачу, в которой у нас было фиксировано число $n$ испытаний, и в которой нам требовалось определить вероятность того, что за эти $n$ испытаний у нас выпадет ровно $k$ решек. Рассмотрим теперь еще несколько задач, связанных с подбрасыванием монеток, которые приведут нас к чрезвычайно важному понятию цепей Маркова. 

\mysubitem Предположим, что мы подбрасываем монетку до тех пор, пока у нас не выпала решка. Спрашивается, с какой вероятностью нам понадобится ровно $k$ бросаний? 

Вероятность того, что на первом же испытании выпадет решка, равняется, очевидно, $p$. Вероятность того, что это произойдет на втором шаге, равна $p\,q$ --- в первом испытании с вероятностью $q$ должен в этом случае выпасть орел, а во втором испытании с вероятностью $p$ должна выпасть решка. На $k$-м шаге, как видно из аналогичных рассуждений, получаем вероятность $p\,q^{k-1}$. 

Введем случайную величину $\xi$, принимающую значение, равное $k$, в случае, если в рассматриваемом случайном эксперименте решка впервые выпала на $k$-м шаге. Тогда производящая функция, описывающая распределение вероятностей этой случайной величины, имеет следующий вид:
$$
P(z)=0+p\,z+p\,q\,z^2+p\,q^2z^3+\ldots+p\,q^{k-1}z^k+\ldots=\dfrac{pz}{1-qz}.
$$ 
Так как $p=1-q$, то, как и следовало ожидать, $P(1)=1$. 

Сразу заметим важную особенность данной задачи: здесь при любом сколь угодно большом $k$ существует ненулевая вероятность того, что именно на этом испытании в первый раз выпадет решка. Иными словами, множество $X$ значений случайной величины $\xi$ оказывается в данной задаче счетным.

\mysubitem Теперь несколько усложним задачу. Именно, будем теперь подбрасывать монетку до тех пор, пока у нас не выпадет две решки подряд. Пусть случайная величина $\xi$ равна $k$ в случае, если впервые две решки подряд выпадут после $k$ подбрасываний нашей монетки. Нам хочется найти распределение вероятностей данной случайной величины. 


Для этого заметим, что множество всех элементарных исходов нашего случайного эксперимента мы можем описать как счетное множество слов над алфавитом $\{\text{О,Р}\}$, в которых две идущие подряд буквы Р встречаются только в конце слова:
$$
\Omega=\{\text{РР},\text{ОРР},\text{ООРР},\text{РОРР},\text{ОООРР},\text{ОРОРР},\text{РООРР},\ldots\}.
$$
Чтобы получить вероятность появления любой из такой последовательности букв, нам нужно просто заменить Р на $p$ и О на $q$. Возникает вопрос --- как описать данное множество слов?

Оказывается, это достаточно просто сделать с помощью так называемого конечного автомата. Говоря неформально, конечный автомат --- это ориентированный граф, вершины которого называются состояниями. Одна из этих вершин выделяется и называется начальным состоянием. Также в нем выделяется одна или несколько вершин, называемых конечными состояниями. Ребра ориентированного графа помечаются буквами из некоторого алфавита $A$. На вход в автомат (то есть в вершину, помеченную как начальное состояние автомата) подается какое-то слово над тем же алфавитом $A$. Тогда последовательность букв в слове задает нам определенный алгоритм перехода из состояния в состояние. Если слово переводит наш автомат из начального состояния в одно из конечных состояний, то говорят, что конечный автомат допускает данное слово.

\begin{figure}[h]
\centering
  \includegraphics[scale=0.8]{pics/automaton.eps}
\caption{Конечный автомат}
\label{fig:automaton}
\end{figure}

Рассмотрим теперь конечный автомат, изображенный на рис.\ref{fig:automaton}. В этом ориентированном графе четыре вершины (четыре состояния), которые мы можем пометить как $x_0$, $x_1$, $x_2$ и $x_3$. Состояние $x_0$ в данном графе является начальным, состояние $x_2$ --- конечным. Ребра графа помечены буквами О (орел) и Р (решка). Несложно видеть, что этот автомат допускает любое слово из множества $\Omega$. Рассмотрим, к примеру, слово ОРОРР$\in\Omega$. Первая буква слова, буква О, переводит наш автомат из состояния $x_0$ в него же. Следующая буква, буква Р, переводит автомат из состояния $x_0$ в состояние $x_1$. Следующая буква О возвращает автомат в исходное состояние $x_0$. Наконец, две последние буквы Р переводят автомат из состояния $x_0$ в конечное состояние $x_2$. 

Покажем теперь, как с помощью данного конечного автомата построить производящую функцию для искомого распределения вероятностей случайной величины $\xi$ \cite{Grah_Knut_Pat}. Обозначим для этого через $S_n^{(k)}$ произвольное слово длины $n$, которое переводит наш конечный автомат в состояние $x_k$. Ясно, что любое слово $S_n^{(0)}$ можно представить как слово длины $(n-1)$, переводящее конечный автомат в состояние $x_0$ или $x_1$, к концу которого приписана буква О. Следовательно,
$$
S_n^{(0)}=S_{n-1}^{(0)}\,\text{О}+S_{n-1}^{(1)}\,\text{О}.
$$
Аналогично, слова длины $n$, переводящие конечный автомат в состояния $x_1$ или $x_2$, есть слова длины $(n-1)$, переводящие автомат в состояния $x_0$ или $x_1$, к концу которых приписана буква Р. Как следствие,
$$
S_n^{(1)}=S_{n-1}^{(0)}\,\text{Р}, \qquad S_n^{(2)}=S_{n-1}^{(1)}\,\text{Р}.
$$
Наконец, любое слово длины $n$, переводящее автомат в состояние $x_3$, может быть построено из любого слова длины $(n-1)$, переводящего автомат в состояния $x_2$ или $x_3$, путем добавления к нему любой буквы из нашего алфавита:
$$
S_n^{(3)}=S_{n-1}^{(2)}(\text{Р}+\text{О})+S_{n-1}^{(3)}(\text{Р}+\text{О}).
$$
По сути дела, полученные равенства представляют собой рекуррентные соотношения, описывающие слова над алфавитом $\{\text{О,Р}\}$, которые переводят за $n$ шагов конечный автомат из начального состояния в состояние $x_k$. Если в этих равенствах заменить буквы О и Р на вероятности $p$ и $q$, то мы с учетом равенства $p+q=1$ получим рекуррентные соотношения вида
$$
\Pr_n^{(0)}=\Pr_{n-1}^{(0)}\,q+\Pr_{n-1}^{(1)}\,q,\qquad 
\Pr_n^{(1)}=\Pr_{n-1}^{(0)}\,p, \qquad \Pr_n^{(2)}=\Pr_{n-1}^{(1)}\,p,\qquad \Pr_n^{(3)}=\Pr_{n-1}^{(2)}+\Pr_{n-1}^{(3)},
$$
описывающие вероятность попадания конечного автомата в состояние $x_k$ после $n$ шагов. 

В начальный момент времени автомат находится в состоянии $x_0$. Следовательно, начальные условия для выписанных рекуррентных соотношений имеют вид
$$
\Pr_0^{(0)}=1,\qquad \Pr_0^{(1)}=\Pr_0^{(2)}=\Pr_0^{(3)}=0.
$$
Для решения данных рекуррентных соотношений домножим их на $z^n$ и просуммируем по $n$ от $1$ до бесконечности. В результате получим следующую систему рекуррентных соотношений на производящие функции $S^{(k)}(z)$:
$$
P^{(0)}(z)-1=q\,z\,(P^{(0)}(z)+P^{(1)}(z)), \qquad P^{(1)}(z)=p\,z\,P^{(0)}(z),
$$
$$
P^{(2)}(z)=p\,z\,P^{(1)}(z)=p^2z^2P^{(0)}(z),\qquad P^{(3)}(z)=z\,(P^{(2)}(z)+P^{(3)}(z)).
$$
Решение этой системы уравнений дает нам искомую функцию
$$
P^{(2)}(z)=\dfrac{p^2z^2}{1-q\,z-q\,p\,z^2}=p^2z^2+q\,p^2z^3+q\,p^2(p+q)z^4+q^2p^2(2p+q)z^5+\ldots,
$$
описывающую распределение вероятности случайной величины $\xi$. 

\mysubitem Заметим теперь, что тот же самый случайный эксперимент мы могли бы описать несколько по-другому. Введем счетную последовательность случайных величин  $\zeta_0,\zeta_1,\ldots,$ каждая из которых принимает значения из одного и того же множества, а именно, из множества $X=\{0,1,2,3\}$ состояний описанного выше конечного автомата. По условию, случайная величина $\zeta_n$ принимает значение $k$ в случае, если в момент времени $n$ конечный автомат оказался в состоянии $x_k$, $k=0,1,2,3$.

Мы знаем, что в начальный момент времени конечный автомат находится в состоянии $x_0$. Следовательно, случайная величина $\zeta_0$ с вероятностью $1$ принимает значение $0$, и с нулевой вероятностью --- значения $1$, $2$ и $3$. Наша задача --- определить распределение вероятностей случайной величины $\zeta_n$ для любого $n>0$. 

Начнем с распределения вероятностей случайной величины $\zeta_1$. Подадим на вход в автомат некоторую букву. С вероятностью $q$ это будет буква О. В этом случае мы останемся в состоянии $x_0$. С вероятностью $p$ к нам на вход придет буква Р, и автомат окажется в состоянии $x_1$. Следовательно, распределение вероятностей случайной величины $\zeta_1$ можно описать с помощью вектора-строки $[q,p,0,0]$. 

На втором шаге в автомат может быть подана либо буква О (с вероятностью $q$), либо буква Р (с вероятностью $p$). При этом то, куда перейдет после этого автомат, зависит от состояния автомата на первом шаге. Если он находился в состоянии $x_1$, то с вероятностью $q$ мы окажемся в начальном состоянии $x_0$, и с вероятностью $p$ мы попадем в конечное состояние $x_2$. Если же автомат на первом шаге оказался в состоянии $x_0$, то мы с вероятностью $q$ останемся там же, или с вероятностью $p$ перейдем в состояние $x_1$. Вероятность попадания в состояние $x_3$ на данном шаге равна, очевидно, нулю. На языке случайных величин это означает, что распределение вероятностей случайной величины $\zeta_2$ имеет следующий вид: $[q\,p+q^2,q\,p,p^2,0]$. 

Заметим теперь, что распределения вероятностей случайных величин $\zeta_2$ и $\zeta_1$ выражаются через распределения вероятностей случайных величин $\zeta_1$ и $\zeta_0$ с помощью матрицы вида
$$
\mathbf P=\begin{bmatrix}
q&p&0&0\\
q&0&p&0\\
0&0&0&1\\
0&0&0&1
\end{bmatrix}:
$$
$$
[q,p,0,0]=[1,0,0,0]\times\begin{bmatrix}
q&p&0&0\\
q&0&p&0\\
0&0&0&1\\
0&0&0&1
\end{bmatrix},\qquad\qquad
[q\,p+q^2,q\,p,p^2,0]=[q,p,0,0]\times\begin{bmatrix}
q&p&0&0\\
q&0&p&0\\
0&0&0&1\\
0&0&0&1
\end{bmatrix}.
$$ 
Эта матрица легко может быть построена с помощью конечного автомата, если вместо букв пометить ребра соответствующими вероятностями (смотри рис.\ref{fig:automaton_prob}). Так, первая строка означает, что мы из состояния $x_0$ можем с вероятностью $q$ в него же и вернуться, с вероятностью $p$ оказаться в состоянии $x_1$ и с нулевой вероятностью можем оказаться в состоянии $x_2$. Остальные две строки матрицы строятся по аналогичному принципу. 


\begin{figure}[h]
\centering
  \includegraphics[scale=0.8]{pics/automaton_prob.eps}
\caption{Конечный автомат}
\label{fig:automaton_prob}
\end{figure}


Несложно понять, что и в общем случае распределения вероятностей случайных величин $\zeta_{n+1}$ и $\zeta_n$ связаны описанной выше матрицей $\mathbf P$:
$$
[\Pr(\zeta_{n+1}=0),\ldots,\Pr(\zeta_{n+1}=3)]=[\Pr(\zeta_n=0),\ldots,\Pr(\zeta_n=3)]\times\begin{bmatrix}
q&p&0&0\\
q&0&p&0\\
0&0&0&1\\
0&0&0&1
\end{bmatrix}.
$$
Иными словами, распределение вероятностей случайной величины $\zeta_{n+1}$ полностью определяется распределением случайной величины $\zeta_n$. Такого рода последовательность случайных величин и называется цепью Маркова. 

\myitem Перейдем к формальным определениям.

\mysubitem Пусть у нас имеется некоторая система, которая в дискретные моменты времени $t=0,1,\ldots,n,\ldots$ случайно переходит из одного состояния в другое. Обозначим через $X$, $X=\{x_0,\ldots,x_k\}$, множество состояний этой системы. Рассмотрим последовательность $(\zeta_0,\zeta_1,\ldots)$ случайных  величин, принимающих значения из одного и того же множества $\{0,1,\ldots,k\}$ и описывающих состояние системы в момент времени $t=n$. В общем случае вероятность того, что случайная величина $\zeta_n$ принимает значение $i$, зависит от того, в каких состояниях находилась система во все предыдущие моменты времени, то есть какие значения принимали случайные величины $\zeta_0,\zeta_1,\ldots,\zeta_{n-1}$ во все предшествующие моменты времени. 

\begin{defin} Последовательность $\zeta_0,\zeta_1,\ldots,\zeta_n,\ldots$ случайных величин называется \emph{цепью Маркова}, если вероятность того, что случайная величина $\zeta_{n+1}$ принимает значение $j$, зависит только от того, какое значение принимала случайная величина $\zeta_n$ в предшествующий момент времени:
$$
\Pr(\zeta_{n+1}=j\mid\zeta_0=l,\ldots,\zeta_n=i)=
\Pr(\zeta_{n+1}=j\mid\zeta_n=i).
$$
\end{defin}

Говоря неформально, цепь Маркова --- это последовательность случайных событий, характеризующаяся тем, что при фиксированном настоящем $(\zeta_n=i)$ будущее (то есть вероятность того, что $\zeta_{n+1}=j$) не зависит от прошлого (то есть от того, какими были значения случайных величин $\zeta_0,\zeta_1,\ldots,\zeta_{n-1}$). 

\mysubitem Для наглядной визуализации марковской цепи часто используют взвешенный орграф, вершины которого соответствуют состояниям системы, а ребра помечаются вероятностями перехода из одного состояния в другое. Вероятности 
$$
p_{ij}=\Pr(\zeta_{n+1}=j\mid\zeta_n=i)
$$
перехода из состояния $x_i$ в состояние $x_j$ образуют так называемую матрицу перехода, которая в случае конечного $(|X|=k)$ множества состояний записывается в виде
$$
\mathbf P=
\begin{bmatrix}
p_{00}&p_{01}&p_{02}&\ldots&p_{0k}\\
p_{10}&p_{11}&p_{12}&\ldots&p_{1k}\\
p_{20}&p_{21}&p_{22}&\ldots&p_{2k}\\
\ldots&\ldots&\ldots&\ldots&\ldots\\
p_{k0}&p_{k2}&p_{k3}&\ldots&p_{kk}
\end{bmatrix}.
$$
Любой элемент $i$-й строки этой матрицы описывает вероятность перехода из состояния $i$ в какое-то другое состояние системы. Так как система из любого своего состояния должна куда-то перейти, то очевидно, что сумма элементов каждой строки матрицы $\mathbf P$ равна единице:
$$
\sum\limits_{j=0}^kp_{ij}=1\qquad \forall\,i=0,\ldots,k.
$$
Матрицы, для которых выполняется данное свойство, называются \emph{стохастическими матрицами.} 

В принципе, вероятности $p_{ij}$ перехода могут зависеть от момента времени $n$. В случае, когда они от $n$ не зависят, цепь Маркова называется \emph{однородной.} В этом случае
$$
[\Pr(\zeta_n=0),\Pr(\zeta_n=1),\ldots,\Pr(\zeta_n=k)]=
[\Pr(\zeta_0=0),\Pr(\zeta_0=1),\ldots,\Pr(\zeta_0=k)]\times\mathbf P^n.
$$
Данное соотношение есть частный случай так называемого \emph{уравнения Колмогорова-Чепмена,} которое в несколько более общем виде записывается так:
$$
\mathbf P(n+m)=\mathbf P(n)\times\mathbf P(m),\qquad \qquad \text{где}\quad \mathbf P(n)=\mathbf P(\zeta_n=x_j|\zeta_0=x_i).
$$

Обозначим через $p_i=\Pr(\zeta_0=i)$. Вектор $[p_0,p_1,\ldots,p_k]$ называется вектором начального распределения вероятностей. 


\myitem Приведем несколько характерных примеров марковских цепей.

\mysubitem Начнем с моделирования так называемых \emph{случайных блужданий} частицы. 

\begin{examp}
Пусть $\xi_1,\xi_2,\ldots$ есть последовательность \emph{независимых} случайных величин, принимающих ровно два значения $1$ и $-1$ с вероятностями $\Pr(\xi_n=1)=p$, $\Pr(\xi_n=-1)=q$, $p+q=1$. Положим 
$$
\zeta_0=0,\qquad \qquad \zeta_n=\sum\limits_{i=1}^n\xi_i.
$$
Последовательность $\zeta_0,\zeta_1,\ldots$ называется \emph{простым случайным блужданием.} Эта последовательность образует цепь Маркова с переходными вероятностями
$$
p_{ij}=\left\{
\begin{array}{ll}
p,&j=i+1,\qquad\\
q,&j=i-1,\\
0,&j\notin\{i-1,i+1\}.
\end{array}
\right.
$$
Чтобы записать матрицу перехода, нужно как-то переставить состояния.
\end{examp}

\begin{examp}
Рассмотрим теперь пример случайного блуждания с двумя отражающими экранами. В этом примере предполагается, что в точках $0$ и $k$ стоят экраны. Блуждающая частица до момента попадания в состояния $0$ или $k$ движется так же, как и в примере простого случайного блуждания. При попадании на экран частица в следующий момент времени либо остается в данном состоянии с вероятностью $q$, либо отходит от экрана на единичное расстояние с вероятностью $p$. Матрица перехода имеет в этом случае размеры $(k+1)\times(k+1)$ и записывается в виде
$$
\mathbf P=
\begin{bmatrix}
q&p&0&0&\ldots&0&0\\
q&0&p&0&\ldots&0&0\\
0&q&0&p&\ldots&0&0\\
\ldots&\ldots&\ldots&\ldots&\ldots&\ldots&\ldots\\
0&0&0&0&\ldots&p&q
\end{bmatrix}.
$$
\end{examp}

\mysubitem Традиционным примером в теории марковских цепей является пример с предсказанием погоды. 

\begin{examp}
Предположим, что погода в прогнозах классифицируется как ясная, умеренно пасмурная и пасмурная. Если погода ясная, то вероятность того, что она таковой и останется, равна $0.5$, вероятность того, что она станет умеренно пасмурной, равна $0.4$, а вероятность того, что она станет пасмурной, равна $0.1$. Если погода является умеренно пасмурной, то вероятность того, что она таковой и останется, составляет $0.5$, а того, что она станет ясной или пасмурной, составляет соответственно $0.3$ и $0.2$. Наконец, если она была пасмурной, то вероятность остаться пасмурной составляет $0.4$, а вероятность смены погоды на ясную или умеренно пасмурную составляет $0.2$ и $0.4$ соответственно. Матрица перехода в этом случае выглядит, очевидно, так:
$$
\mathbf P=
\begin{bmatrix}
0.5&0.4&0.1\\
0.3&0.5&0.2\\
0.2&0.4&0.4
\end{bmatrix}.
$$
Если в понедельник мы имели ясную погоду, то вероятность того, что в среду она окажется пасмурной, равна $0.17$, так как
$$
[1,0,0]\times \mathbf P^2=[0.39,0.44,0.17].
$$
\end{examp}


\myitem Как правило, в задачах хочется узнать не только распределение вероятностей случайной величины $\zeta_n$ при фиксированном $n$, но и понять, как ведет себя это распределение при $n\to\infty$. Часто при больших $n$ процесс сходится к некоторому стационарному состоянию. В этой связи возникает масса вопросов: к какому состоянию сходится данный процесс, как быстро он туда сходится, и как определить по исходной диаграмме состояний (или по исходной матрице перехода), как и куда будет данный процесс сходиться. Приведем очень коротко основной набор связанных с этими вопросами фактов. Более подробные сведения по этому поводу можно получить из классических книг \cite{Finity_Markov} или \cite{Feller}. 

\mysubitem Прежде всего, дадим несколько важных определений.

\begin{defin} 
Говорят, что состояние $x_j$ \emph{достижимо} из состояния $x_i$ (или следует за состоянием $x_i$, обозначение  $x_i\to x_j$), если из состояния $x_i$ система может перейти в состояние $x_j$ с положительной вероятностью за конечное число шагов. Если $x_i\to x_j$ и $x_j\to x_i$, то состояния называются \emph{сообщающимися} (и обозначается это как $x_i\leftrightarrow x_j$).
\end{defin}

Понятно, что отношение $\leftrightarrow$ является отношением эквивалентности, разбивающим множество состояний на классы эквивалентностей --- так называемые \emph{классы сообщающихся состояний.} С точки зрения теории графов каждый такой класс есть компонента сильной связности диаграммы состояний. Если мы из какого-то класса выходим в какой-то другой класс, то вернуться обратно мы уже, очевидно, не сможем.  

Все классы сообщающихся состояний можно разбить на две группы --- классы открытых (или невозвратных) состояний и классы замкнутых (или возвратных, или эргодических) состояний. 

\begin{defin} 
Класс сообщающихся состояний называется \emph{замкнутым} (или \emph{эргодическим}), если вероятность покинуть этот класс равна нулю. Иными словами, если $x_i$ принадлежит этому классу, а $x_j$ нет, то $x_j$ не достижимо из $x_i$. В противном случае класс называется \emph{открытым.} 
\end{defin}

\begin{defin} 
Состояния, принадлежащие замкнутым классам, называются \emph{существенными,} или \emph{эргодическими,} или \emph{возвратными,} а состояния, принадлежащие открытым классам --- \emph{несущественными} или \emph{невозвратными.} 
\end{defin}

\begin{defin} 
Цепи, состоящие из одного класса замкнутых (или эргодических) состояний, называется эргодическими цепями. 
\end{defin}

\begin{defin}
Если замкнутый класс состоит из единственного состояния, то оно называется \emph{поглощающим.} Марковская цепь, в которой есть хотя бы одно поглощающее состояние, и в которой из любого состояния достижимо хотя бы одно поглощающее, называется \emph{поглощающей цепью.} 
\end{defin}

В нашем первом примере с подбрасыванием монеток до выпадения двух решек мы имели два класса состояний. Состояния $x_0$, $x_1$ и $x_2$ принадлежали одному и тому же, открытому классу, и потому являлись несущественными. Ко второму классу относилось единственное состояние $x_3$. Этот класс являлся замкнутым, а состояние $x_3$ --- поглощающим. Следовательно, данная марковская цепь являлась поглощающей. 

\mysubitem В примере мы для состояния $x_3$ имели $p_{33}=1$. Данный факт является общим --- для любого поглощающего состояния $x_i$ справедливо равенство $x_{ii}=1$. Это обстоятельство, в свою очередь, приводит к следующему утверждению.

\begin{propos}
Если марковская цепь является поглощающей, то она с вероятностью, равной единице, перейдет в поглощающее состояние.
\end{propos}

Так, в нашем примере с подбрасыванием монеток рано или поздно две решки подряд обязательно выпадут. 

\mysubitem Важным частным случаем эргодических марковских цепей являются так называемые регулярные марковские цепи.

\begin{defin}
Марковская цепь называется регулярной, если все элементы матрицы перехода больше нуля. Иными словами, в такой цепи любое состояние может быть достигнуто из любого другого состояния за достаточно большое количество шагов . 
\end{defin}

\begin{theor} Пусть $\mathbf P$ есть матрица перехода регулярной цепи Маркова. Тогда существует предел
$$
\lim_{n\to+\infty}\mathbf P^n=\mathbf P^{\infty},
$$
причем предельная матрица $\mathbf P^{\infty}$ состоит из $k$ одинаковых строк вида $\alpha=(a_1,a_2,\ldots,a_k)$. 
\end{theor}

Числа $a_1,\ldots,a_k$ называются предельными вероятностями. Можно показать, что они никак не зависят от начального распределения вероятностей, то есть от распределения вероятностей случайной величины $\zeta_0$. 





\section*{Упражения}
\begin{exerc} 
Последовательность $\xi_1,\xi_2,\ldots$ \emph{независимых} случайных величин есть частный случай марковской цепи. Установить, при каком условии марковская цепь описывает независимые случайные величины. 
\end{exerc}

\begin{exerc} 
В вершине $C$ правильного пятиугольника $ABCDE$ находится червяк, а в вершине $A$~--- яблоко. Каждый день червяк переползает в одну из двух соседних вершин с равной вероятностью, не зависящей от предыдущих состояний. Если червяк оказывается в вершине $A$, то он останавливается там пообедать. Чему равно математическое ожидание и дисперсия числа дней, прошедших до обеда? Оцените с помощью неравенства Чебышева вероятность того, что до обеда пройдёт $100$ или более дней.
\end{exerc}

\begin{exerc} 
Пять человек стоят в вершинах правильного пятиугольника и бросают друг другу диски фрисби. Изначально имеется два диска, расположенных в соседних вершинах пятиугольника. В очередной момент времени каждый диск бросают либо влево, либо вправо с равной вероятностью. Этот процесс заканчивается, когда одному человеку бросят два диска. Найдите математическое ожидание и дисперсию числа бросков. 
\end{exerc}

\begin{exerc} 
У самолёта четыре мотора. Для выполнения боевого задания ему необходимо оставаться в воздухе в течение часа. Из-за вражеского обстрела в каждый $15$-минутный период вероятность выхода из строя каждого мотора равна $0,25.$ Для продолжения полёта самолёту нужно как минимум два мотора. С какой вероятностью самолёт вернётся на базу?
\end{exerc}

\begin{exerc} 
Рассмотрим следующую азартную игру. Игрок ставит определённую сумму $A$ и бросает правильный кубик. Если на кубике выпало $k$ очков, то сумма увеличивается в $2(k-1) / 5$ раз. В частности, если выпадает $1$, то игрок проигрывает всё. В любой момент можно остановиться и забрать выигранную сумму. Чему равно математическое ожидание и дисперсия суммы после $n$ бросаний?
\end{exerc}

\begin{exerc} 
Несколько физиологов в сотрудничестве с несколькими физиками обнаружили две новых разновидности микробов. Они называются дифагами и трифагами и имеют, соответственно, по два и три рецептора. При облучении колонии микробов пси-частицами каждая такая частица равновероятно поглощается ровно одним из рецепторов одного из микробов. Если пси-частица поглотилась рецептором дифага, то последний превращается в трифаг. В случае, когда пси-частицу поглощает рецептор трифага, этот трифаг делится на два дифага. Так, если в начале эксперимента имеется один дифаг, то первая пси-частица вызывает его превращение в трифаг, вторая разделит трифаг на два дифага, а третья превращает один из дифагов в трифаг. Четвертая частица попадет либо в дифаг (с вероятностью $2/5$), либо в трифаг (с вероятностью $3/5$). В первом случае получаются два трифага, во втором --- три дифага. Найдите замкнутое выражение для среднего числа дифагов после $n$ шагов такого эксперимента.
\end{exerc}



\section*{Решение упражнений}
\begin{sol_exerc} 
В случае независимых случайных величин $\xi_1,\xi_2,\ldots$ вероятность того, что случайная величина $\xi_{n+1}$ принимает значение $i$, не зависит от того, какое именно значение принимала случайная величина $\xi_n$ на предыдущем шаге случайного процесса. Но для марковских процессов
$$
[\Pr(\xi_{n+1}=0),\Pr(\xi_{n+1}=1),\ldots,\Pr(\xi_{n+1}=k)]=
[\Pr(\xi_{n}=0),\Pr(\xi_{n}=1),\ldots,\Pr(\xi_{n}=k)]\times\mathbf P_n,
$$
где $\mathbf P_n$ есть матрица, любой элемент $p_{ij}$ которой равен условной вероятности $\Pr(\xi_{n+1}=j\mid \xi_n=i)$. Если мы хотим, чтобы случайные величины $\xi_{n+1}$ и $\xi_i$ были независимыми, нам нужно потребовать, чтобы
$$
\forall\,\, i=0,\ldots,k\qquad\qquad \Pr(\xi_{n+1}=j\mid \xi_n=i)=\Pr(\xi_{n+1}=j),
$$
то есть не зависели от $i$. На языке матрицы $\mathbf P_n$ это означает, что в такой матрице элементы любого столбца должны быть одинаковы. Иначе говоря, все строки этой матрицы должны быть равны между собой.  
\end{sol_exerc}

\begin{sol_exerc} 
Проще всего свести данную задачу к разобранной в данном параграфе задаче о подбрасывании монетки до тех пор, пока у нас не выпадет две решки подряд. Действительно, появление решки означает, что червяк сделал один шаг к яблоку, а две решки --- что он до яблока дошел. Поэтому производящая функция для случайной величины $\xi$, описывающей попадание червяка в вершину $A$ за $n$ шагов, имеет вид
$$
f(z) = \frac{z^2}{4-2z-z^2}.
$$
Зная ее, легко вычислить математическое ожидание и дисперсию случайной величины $\xi$:
$$
\EV(\xi) = f'(1)=6;\qquad
\VR(\xi) =  f''(1) + f'(1) - (f'(1))^2 = 52 + 6 - 36 = 22.
$$
Наконец, используя неравенство Чебышева, получаем следующую вероятность того, что червяк доползет до яблока за сто или более дней:
$$
\Pr(|\xi - 6| \geq 94) \leq \frac{1} { (94/\sqrt{22})^2} = 0.0025\,.
$$
\end{sol_exerc}



\begin{sol_exerc} 
Процесс бросания дисков в любой момент времени $n$ можно описать случайной величиной $\xi$, равной расстоянию между дисками. Эта случайная величина принимает значение из множества $X=\{0,1,2\}$. В начальный момент времени $\xi=1$. Если в момент времени $n$ случайная величина $\xi$ принимает значение, равное $1$, то в следующий момент времени она в трех случаях из четырех сохранит это же значение, а в одном из четырех случаев увеличит свое значение на единицу. Сохранить свое значение неизменным в случае $\xi=2$ случайная величина сможет с вероятностью, равной одной второй. С вероятностью же $1/4$ она на следующем шаге станет равной либо нулю, либо единице.  

Проведенные рассуждения позволяют нам записать следующую систему соотношений, описывающую вероятность $\Pr_n^{(i)}$ того, что после $n$ шагов случайная величина $\xi$ примет одно из трех значений $i=0,1,2:$
$$
\Pr_n^{(1)}=\dfrac{3}{4}\Pr_{n-1}^{(1)}+\dfrac{1}{4}\Pr_{n-1}^{(2)}, \qquad 
\Pr_n^{(2)}=\dfrac{1}{4}\Pr_{n-1}^{(1)}+\dfrac{1}{2}\Pr_{n-1}^{(2)},\qquad
\Pr_n^{(0)}=\dfrac{1}{4}\Pr_{n-1}^{(2)}.
$$
Домножим каждое уравнение этой системы рекуррентных соотношений на $z^n$ и просуммируем по $n$ от нуля до бесконечности. С учетом начальных условий  получим следующую систему линейных алгебраических уравнений на производящие функции $S_i(z)$, $i=0,1,2:$
$$
S_1(z)-1=\dfrac{3z}{4}S_1(z)+\dfrac{z}{4}S_2(z),\qquad
S_2(z)=\dfrac{z}{4}S_1(z)+\dfrac{z}{2}S_2(z),\qquad
S_0(z)=\dfrac{z}{4}S_2(z).
$$
Отсюда следует, что функция
$$
S_0(z) = \frac{z^2}{5z^2-20z+16}.
$$
Для нахождения математического ожидания и дисперсии достаточно взять первую и вторую производную данной функции и вычислить их значения в точке $z=1$. Несложно показать, что математическое ожидание оказывается равным $12$, а дисперсия равна $100.$
\end{sol_exerc}

\begin{sol_exerc} Самолёт может находиться в одном из четырёх состояний: работает 4 мотора, работает 3 мотора, работает 2 мотора и самолёт сбит. Можно, как и в предыдущем упражнении, составить систему уравнений, описывающую вероятности перехода между этими состояниями, однако мы продемонстрируем другой способ. 

В действительности, каждый мотор раз в $15$ минут независимо от других с вероятностью $0.25$ переходит в нерабочее состояние в том случае, если он все ещё работает. Таким образом, каждый мотор проработает в течение часа с вероятностью $(\frac{3}{4})^4 = \frac{81}{256}$. Вероятность того, что ровно $k$ моторов проработают в течение часа, равна
$$
p_k = \binom{4}{k}\cdot \Bigl( \frac{81}{256} \Bigr ) ^k \cdot \Bigl( \frac{175}{256} \Bigr )^{4-k}.
$$
Поэтому искомая вероятность $p$ того, что как минимум два мотора не выйдут из строя, равна 
$$
p = 1 - p_0 - p_1 = 1 - 0.2183 - 0.2763 = 0.5054.
$$
\end{sol_exerc}

\begin{sol_exerc} 
Рассмотрим выражение вида
$$
S_n:=( 0 + 2/5 + 4/5 + \ldots + 10/5)^n.
$$
Если перемножить входящие в него $n$ скобок, не вычисляя предварительно сумму внутри каждой скобки, то каждое слагаемое в ответе будет соответствовать какой-то одной фиксированной последовательности $f_n$ выпадений кубика. При этом каждое такое слагаемое будет говорить нам о том, во сколько раз при такой последовательности $f_n$ выпадений кубика увеличилась начальная ставка. Наконец, заметим, что вероятность появления произвольной последовательности $f_n$ одинакова и равна $1/6^n$. Соответственно, математическое ожидание случайной величины $\xi$  описывающей коэффициент увеличения или уменьшения ставки на $n$-м шаге, равно 
$$
\EV(\xi) = \frac{1}{6^n} \cdot S_n= \frac{1}{6^n}\cdot \Bigl( \frac{30}{5} \Bigr)^n = 1.
$$
В силу линейности математического ожидания, средний выигрыш при начальной ставке $A$ останется равным $A$.

Постараемся теперь провести такие же рассуждения и для математического ожидания случайной величины $\xi^2$, необходимого для вычисления дисперсии. Очевидно, что когда $\xi$ увеличивается в $k$ раз, то $\xi^2$ увеличивается в $k^2$ раз. Поэтому вместо $S_n$ для случайной величины $\xi^2$ нужно использовать выражение вида
$$
\left( 0 + (2/5)^2 + (4/5)^2 + \ldots + (10/5)^2\right)^n = \Bigl ( \frac{220}{25} \Bigr ) ^ n.
$$
Умножая эту сумму на $1/6^n$ и учитывая, что для любой константы $A$ справедливо равенство вида $\VR(A\xi)=A^2\VR(\xi)$, мы получаем для $\xi$ следующую величину дисперсии:
$$
\VR(\xi) = A^2 \cdot  \Bigl( \frac{22}{15} \Bigr )^n -  \EV(\xi)^ 2 = A^2 \cdot \Bigl ( \frac{22}{15} \Bigr )^n  - A^2.
$$ 
\end{sol_exerc}

\begin{sol_exerc} 
Обозначим через $X_n$ количество дифагов после $n$ шагов эксперимента. Тогда $X_{n+1} = X_n + Y_n$, где $Y_n=-1$ в случае, когда $(n+1)$-я частица попадает в дифаг, и $Y_n=2$ в случае, когда она попадает в трифаг. В силу линейности математического ожидания,
$$
\EV(X_{n+1}) = \EV(X_{n}) +  \EV(Y_{n}).
$$
Так как после поглощения $n$ частиц в системе имеется ровно $(n+2)$ рецептора, то вероятность попадания $(n+1)$-й частицы в любой из двух рецепторов дифага равна $2X_n/(n+2)$. Соответственно, вероятность попадания ее на рецептор трифага равна $1-2X_n/(n+2)$. Поэтому
$$
\EV(X_{n+1}) = \EV(X_{n}) - \EV(X_n) \cdot \frac{2}{n+2} + 2 \cdot \Biggl ( 1 - \EV(X_n) \cdot \frac{2}{n+2} \Biggr ),
$$
и мы для $\EV(X_n)$ получаем следующее рекуррентное соотношение:
 $$
(n+2) \cdot \EV(X_{n+1}) = (n-4) \cdot \EV(X_n)  + 2(n + 2).
$$
Пусть $\EV(X_n)=(n+2)\,a_n$. Тогда для $a_n$ имеем уравнение вида
$$
(n+3)\,a_{n+1}=(n-4)\,a_n+2,
$$
которое выполняется при $a_n=\const=2/7$. Следовательно, $\EV(X_n)=(2n + 4) / 7$.
\end{sol_exerc}





\newpage

\bibliography{Ref_book}

\end{document}
